快捷方式

torch.cuda.comm.reduce_add

torch.cuda.comm.reduce_add(inputs, destination=None)[原始碼][原始碼]

對來自多個 GPU 的張量進行求和。

所有輸入應具有匹配的形狀、dtype 和佈局。輸出張量將具有相同的形狀、dtype 和佈局。

引數
  • inputs (Iterable[Tensor]) – 可迭代的待相加張量。

  • destination (int, optional) – 輸出張量將放置的裝置(預設值:當前裝置)。

返回

一個張量,包含所有輸入按元素相加的結果,放置在 destination 裝置上。

文件

訪問 PyTorch 全面的開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源