torch.cuda.comm.reduce_add¶ torch.cuda.comm.reduce_add(inputs, destination=None)[原始碼][原始碼]¶ 對來自多個 GPU 的張量進行求和。 所有輸入應具有匹配的形狀、dtype 和佈局。輸出張量將具有相同的形狀、dtype 和佈局。 引數 inputs (Iterable[Tensor]) – 可迭代的待相加張量。 destination (int, optional) – 輸出張量將放置的裝置(預設值:當前裝置)。 返回 一個張量,包含所有輸入按元素相加的結果,放置在 destination 裝置上。