快捷方式

MPS 環境變數

PyTorch 環境變數

變數

描述

PYTORCH_DEBUG_MPS_ALLOCATOR

如果設定為 1,則將分配器日誌級別設定為詳細。

PYTORCH_MPS_LOG_PROFILE_INFO

將日誌選項位掩碼設定為 MPSProfiler。有關可用選項,請參閱 aten/src/ATen/mps/MPSProfiler.h 中的 LogOptions 列舉。

PYTORCH_MPS_TRACE_SIGNPOSTS

將配置檔案和標誌位掩碼設定為 MPSProfiler。有關可用選項,請參閱 aten/src/ATen/mps/MPSProfiler.h 中的 ProfileOptionsSignpostTypes 列舉。

PYTORCH_MPS_HIGH_WATERMARK_RATIO

MPS 分配器的高水位比。預設設定為 1.7。

PYTORCH_MPS_LOW_WATERMARK_RATIO

MPS 分配器的低水位比。預設情況下,如果記憶體是統一記憶體,則設定為 1.4;如果記憶體是獨立記憶體,則設定為 1.0。

PYTORCH_MPS_FAST_MATH

如果設定為 1,則為 MPS Metal 核心啟用快速數學。有關精度影響,請參閱 https://developer.apple.com/metal/Metal-Shading-Language-Specification.pdf 中的 1.6.3 節。

PYTORCH_MPS_PREFER_METAL

如果設定為 1,則強制使用 Metal 核心而不是使用 MPS Graph API。目前僅用於 matmul 操作。

PYTORCH_ENABLE_MPS_FALLBACK

如果設定為 1,當 MPS 不支援某些操作時,回退到 CPU 進行處理。

注意

高水位比 是總允許分配的硬限制

  • 0.0 : 停用高水位限制(如果發生系統範圍的 OOM,可能會導致系統故障)

  • 1.0 : 建議的最大分配大小(即 device.recommendedMaxWorkingSetSize)

  • >1.0: 允許超出 device.recommendedMaxWorkingSetSize 的限制

例如,值 0.95 表示我們最多分配建議最大分配大小的 95%;超出此範圍,分配將因 OOM 錯誤而失敗。

低水位比 是一個軟限制,嘗試透過垃圾回收或更頻繁地提交命令緩衝區(也稱為自適應提交)將記憶體分配限制在較低水位水平。值介於 0 到 m_high_watermark_ratio 之間(設定為 0.0 會停用自適應提交和垃圾回收),例如,值 0.9 表示我們“嘗試”將分配限制在建議最大分配大小的 90%。

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源