torchvision¶
該庫是 PyTorch 專案的一部分。PyTorch 是一個開源機器學習框架。
本文件中描述的功能按釋出狀態分類
Stable (穩定): 這些功能將長期維護,通常不會有主要的效能限制或文件空白。我們也期望保持向後相容性(儘管可能發生破壞性變更,但會提前一個版本發出通知)。
Beta (測試版): 功能被標記為 Beta 版,是因為其 API 可能根據使用者反饋而變化,效能需要改進,或者對運算元的覆蓋尚未完全。對於 Beta 功能,我們致力於將其推進到 Stable 分類。但我們不承諾向後相容性。
Prototype (原型): 這些功能通常不作為 PyPI 或 Conda 等二進位制發行版的一部分提供,除非有時透過執行時標誌啟用,並且處於早期階段,用於收集反饋和進行測試。
torchvision 包包含流行的計算機視覺資料集、模型架構和常用影像轉換。
- torchvision.get_video_backend()[source]¶
返回當前用於解碼影片的活動影片後端。
- 返回:
影片後端名稱。{'pyav', 'video_reader'} 之一。
- 返回型別:
- torchvision.set_image_backend(backend)[source]¶
指定用於載入影像的包。
- 引數:
backend (string) – 影像後端名稱。{'PIL', 'accimage'} 之一。
accimage包使用 Intel IPP 庫。它通常比 PIL 快,但不支援那麼多操作。
- torchvision.set_video_backend(backend)[source]¶
指定用於解碼影片的包。
- 引數:
backend (string) – 影片後端名稱。{'pyav', 'video_reader'} 之一。
pyav包使用第三方 PyAv 庫。它是 FFmpeg 庫的 Python 繫結。video_reader包包含基於 FFMPEG 庫的本地 C++ 實現以及 TorchScript 自定義運算元的 python API。它通常比pyav解碼速度更快,但可能不夠穩定。
注意
在最新的 main 分支中,預設停用使用 FFMPEG 構建。如果您想使用 'video_reader' 後端,請從原始碼編譯 torchvision。