快捷方式

torchvision

該庫是 PyTorch 專案的一部分。PyTorch 是一個開源機器學習框架。

本文件中描述的功能按釋出狀態分類

Stable (穩定): 這些功能將長期維護,通常不會有主要的效能限制或文件空白。我們也期望保持向後相容性(儘管可能發生破壞性變更,但會提前一個版本發出通知)。

Beta (測試版): 功能被標記為 Beta 版,是因為其 API 可能根據使用者反饋而變化,效能需要改進,或者對運算元的覆蓋尚未完全。對於 Beta 功能,我們致力於將其推進到 Stable 分類。但我們不承諾向後相容性。

Prototype (原型): 這些功能通常不作為 PyPI 或 Conda 等二進位制發行版的一部分提供,除非有時透過執行時標誌啟用,並且處於早期階段,用於收集反饋和進行測試。

torchvision 包包含流行的計算機視覺資料集、模型架構和常用影像轉換。

示例和訓練參考

torchvision.get_image_backend()[source]

獲取用於載入影像的包的名稱

torchvision.get_video_backend()[source]

返回當前用於解碼影片的活動影片後端。

返回:

影片後端名稱。{'pyav', 'video_reader'} 之一。

返回型別:

str

torchvision.set_image_backend(backend)[source]

指定用於載入影像的包。

引數:

backend (string) – 影像後端名稱。{'PIL', 'accimage'} 之一。accimage 包使用 Intel IPP 庫。它通常比 PIL 快,但不支援那麼多操作。

torchvision.set_video_backend(backend)[source]

指定用於解碼影片的包。

引數:

backend (string) – 影片後端名稱。{'pyav', 'video_reader'} 之一。pyav 包使用第三方 PyAv 庫。它是 FFmpeg 庫的 Python 繫結。video_reader 包包含基於 FFMPEG 庫的本地 C++ 實現以及 TorchScript 自定義運算元的 python API。它通常比 pyav 解碼速度更快,但可能不夠穩定。

注意

在最新的 main 分支中,預設停用使用 FFMPEG 構建。如果您想使用 'video_reader' 後端,請從原始碼編譯 torchvision。

索引¶

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲取問題解答

檢視資源