torchvision¶

該庫是 PyTorch 專案的一部分。PyTorch 是一個開源機器學習框架。

本文件中描述的功能按釋出狀態分類

Stable (穩定): 這些功能將長期維護，通常不會有主要的效能限制或文件空白。我們也期望保持向後相容性（儘管可能發生破壞性變更，但會提前一個版本發出通知）。

Beta (測試版): 功能被標記為 Beta 版，是因為其 API 可能根據使用者反饋而變化，效能需要改進，或者對運算元的覆蓋尚未完全。對於 Beta 功能，我們致力於將其推進到 Stable 分類。但我們不承諾向後相容性。

Prototype (原型): 這些功能通常不作為 PyPI 或 Conda 等二進位制發行版的一部分提供，除非有時透過執行時標誌啟用，並且處於早期階段，用於收集反饋和進行測試。

torchvision 包包含流行的計算機視覺資料集、模型架構和常用影像轉換。

包參考

示例和訓練參考

torchvision.get_image_backend()[source]¶: 獲取用於載入影像的包的名稱

torchvision.get_video_backend()[source]¶

返回當前用於解碼影片的活動影片後端。

返回:: 影片後端名稱。{'pyav', 'video_reader'} 之一。
返回型別:: str

torchvision.set_image_backend(backend)[source]¶

指定用於載入影像的包。

引數:: backend (string) – 影像後端名稱。{'PIL', 'accimage'} 之一。accimage 包使用 Intel IPP 庫。它通常比 PIL 快，但不支援那麼多操作。

torchvision.set_video_backend(backend)[source]¶

指定用於解碼影片的包。

引數:: backend (string) – 影片後端名稱。{'pyav', 'video_reader'} 之一。pyav 包使用第三方 PyAv 庫。它是 FFmpeg 庫的 Python 繫結。video_reader 包包含基於 FFMPEG 庫的本地 C++ 實現以及 TorchScript 自定義運算元的 python API。它通常比 pyav 解碼速度更快，但可能不夠穩定。

注意

在最新的 main 分支中，預設停用使用 FFMPEG 構建。如果您想使用 'video_reader' 後端，請從原始碼編譯 torchvision。

PyTorch 庫

索引¶

索引

torchvision¶

索引¶

文件

教程

資源