快捷方式

後端概述

ExecuTorch 後端為特定的硬體目標提供硬體加速。為了在目標硬體上實現最高效能,ExecuTorch 在匯出和降級過程中針對特定後端對模型進行最佳化。這意味著生成的 .pte 檔案是針對特定硬體定製的。為了部署到多個後端,例如 iOS 上的 Core ML 和 Android 上的 Arm CPU,通常會為每個後端生成一個專門的 .pte 檔案。

硬體後端的選擇取決於模型打算部署到的硬體。每個後端都有特定的硬體要求和模型支援級別。有關詳細資訊,請參閱每個硬體後端的文件。

作為 .pte 檔案建立過程的一部分,ExecuTorch 會識別給定後端支援的模型部分(分割槽)。這些部分由後端提前處理,以支援高效執行。模型中委託不支援的部分(如果存在)將使用 CPU 上的可移植回退實現來執行。這允許在後端並非支援所有模型運算元時實現部分模型加速,但這可能會對效能產生負面影響。此外,可以按優先順序順序指定多個分割槽器。例如,這允許在 GPU 上不支援的運算元透過 XNNPACK 在 CPU 上執行。

可用後端

下面列出了常用的硬體後端。對於移動裝置,請考慮在 Android 上使用 XNNPACK,在 iOS 上使用 XNNPACK 或 Core ML。要為特定後端建立 .pte 檔案,請將相應的分割槽器類傳遞給 to_edge_transform_and_lower。有關更多資訊,請參閱相應的後端文件。

文件

查閱 PyTorch 全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源