多程序包 - torch.multiprocessing¶

torch.multiprocessing 是原生 multiprocessing 模組的包裝器。

它註冊了自定義的 reducer，使用共享記憶體來提供不同程序中相同資料的共享檢視。一旦張量/儲存（storage）被移動到共享記憶體（參見 share_memory_()），就可以在不進行任何複製的情況下將其傳送到其他程序。

該 API 與原始模組 100% 相容 - 只需將 import multiprocessing 改為 import torch.multiprocessing，就可以使透過佇列傳送或透過其他機制共享的所有張量移動到共享記憶體。

由於 API 的相似性，我們不對該包的大部分內容進行文件記錄，建議參考原始模組的優秀文件。

警告

如果主程序突然退出（例如由於接收到訊號），Python 的 multiprocessing 有時會無法清理其子程序。這是一個已知的問題，因此如果在中斷直譯器後看到任何資源洩漏，很可能就是這種情況發生了。

策略管理¶

torch.multiprocessing.get_all_sharing_strategies()[source][source]¶: 返回當前系統支援的共享策略集合。

torch.multiprocessing.get_sharing_strategy()[source][source]¶: 返回當前共享 CPU 張量的策略。

torch.multiprocessing.set_sharing_strategy(new_strategy)[source][source]¶

設定共享 CPU 張量的策略。

引數: new_strategy (str) – 所選策略的名稱。應為 get_all_sharing_strategies() 返回的值之一。

注意

適用於 Python >= 3.4。

這依賴於 Python 的 multiprocessing 包中的 spawn 啟動方法。

透過建立 Process 例項並呼叫 join 等待它們完成，可以生成多個子程序來執行某個函式。這種方法在處理單個子程序時效果很好，但在處理多個程序時可能會出現潛在問題。

具體來說，按順序連線（joining）程序意味著它們將按順序終止。如果不是這樣，並且第一個程序沒有終止，則程序終止將不會被注意到。此外，沒有原生機制用於錯誤傳播。

下面的 spawn 函式解決了這些問題，並負責錯誤傳播、亂序終止，並在檢測到其中一個程序發生錯誤時主動終止其他程序。

torch.multiprocessing.spawn.spawn(fn, args=(), nprocs=1, join=True, daemon=False, start_method='spawn')[source][source]¶

生成 nprocs 個程序，這些程序使用 args 執行 fn。

如果其中一個程序以非零退出狀態退出，其餘程序將被殺死，並丟擲異常，指示終止原因。如果在子程序中捕獲到異常，該異常將被轉發，其回溯資訊將包含在父程序中丟擲的異常中。

引數

fn (函式) –
此函式作為生成的程序的入口點被呼叫。此函式必須在模組的頂層定義，以便可以被序列化（pickled）和生成（spawned）。這是 multiprocessing 強制的要求。

該函式以 fn(i, *args) 的形式呼叫，其中 i 是程序索引，args 是透傳的引數元組。
args (元組) – 傳遞給 fn 的引數。
nprocs (int) – 要生成的程序數。
join (bool) – 對所有程序執行阻塞式連線（join）。
daemon (bool) – 生成程序的守護程序（daemon）標誌。如果設定為 True，將建立守護程序。
start_method (str) – (已棄用) 此方法將始終使用 spawn 作為啟動方法。要使用不同的啟動方法，請使用 start_processes()。

返回

如果 join 為 True 則返回 None，如果 join 為 False 則返回 ProcessContext

class torch.multiprocessing.SpawnContext[source][source]¶

當呼叫 spawn() 時且 join=False 時返回。

join(timeout=None, grace_period=None)[source]¶

連線（join）spawn 上下文中的一個或多個程序。

嘗試連線（join）此 spawn 上下文中的一個或多個程序。如果其中一個以非零退出狀態退出，此函式將殺死其餘程序（可選擇給予寬限期），並丟擲異常，指示第一個程序退出的原因。

如果所有程序都已成功連線（joined），則返回 True，如果還有更多程序需要連線，則返回 False。

引數

timeout (浮點數) – 等待此時長（秒）後放棄等待。
grace_period (浮點數) – 當任何程序失敗時，等待此時長（秒）讓其他程序優雅關閉，然後終止它們。如果它們仍未退出，則再等待一個寬限期後殺死它們。