快捷方式

decode_avif

torchvision.io.decode_avif(input: Tensor, mode: ImageReadMode = ImageReadMode.UNCHANGED) Tensor[source]

將 AVIF 影像解碼為 3 維 RGB[A] 張量。

警告

為了啟用 torchvision 的 AVIF 解碼功能,您首先需要執行 pip install torchvision-extra-decoders。只需安裝該包,您無需更新程式碼。此功能僅在 Linux 上受支援,並且仍處於 BETA 階段。如有任何問題,請告知我們:https://github.com/pytorch/vision/issues/new/choose。請注意,torchvision-extra-decoders 是根據 LGPL 許可證釋出的。

大多數影像的輸出張量值為 uint8 型別,範圍在 [0, 255] 內。如果影像的位深大於 8,則輸出張量為 uint16 型別,範圍在 [0, 65535] 內。由於 pytorch 對 uint16 的支援有限,我們建議在此函式之後呼叫 torchvision.transforms.v2.functional.to_dtype() 並設定 scale=True,以便將解碼後的影像轉換為 uint8 或 float 張量。

引數:
  • input (Tensor[1]) – 包含 AVIF 影像原始位元組的一維連續 uint8 張量。

  • mode (str or ImageReadMode) – 影像轉換模式,例如 “RGB”。預設值為 “UNCHANGED”。有關可用模式,請參閱 ImageReadMode

返回:

解碼後的影像 (Tensor[image_channels, image_height, image_width])

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源