torch.cuda.comm.broadcast_coalesced¶
- torch.cuda.comm.broadcast_coalesced(tensors, devices, buffer_size=10485760)[源][源]¶
將一系列張量廣播到指定的 GPU。
小張量首先被合併到一個緩衝區中,以減少同步次數。
- 引數
tensors (sequence) – 要廣播的張量。必須在同一個裝置上,可以是 CPU 或 GPU。
devices (Iterable[torch.device, str or int]) – GPU 裝置的可迭代物件,用於廣播。
buffer_size (int) – 用於合併的緩衝區的最大大小
- 返回
一個元組,包含
tensor的副本,放置在devices上。