decode_avif¶
- torchvision.io.decode_avif(input: Tensor, mode: ImageReadMode = ImageReadMode.UNCHANGED) Tensor[source]¶
將 AVIF 影像解碼為 3 維 RGB[A] 張量。
警告
為了啟用 torchvision 的 AVIF 解碼功能,您首先需要執行
pip install torchvision-extra-decoders。只需安裝該包,您無需更新程式碼。此功能僅在 Linux 上受支援,並且仍處於 BETA 階段。如有任何問題,請告知我們:https://github.com/pytorch/vision/issues/new/choose。請注意,torchvision-extra-decoders 是根據 LGPL 許可證釋出的。大多數影像的輸出張量值為 uint8 型別,範圍在 [0, 255] 內。如果影像的位深大於 8,則輸出張量為 uint16 型別,範圍在 [0, 65535] 內。由於 pytorch 對 uint16 的支援有限,我們建議在此函式之後呼叫
torchvision.transforms.v2.functional.to_dtype()並設定scale=True,以便將解碼後的影像轉換為 uint8 或 float 張量。- 引數:
input (Tensor[1]) – 包含 AVIF 影像原始位元組的一維連續 uint8 張量。
mode (str or ImageReadMode) – 影像轉換模式,例如 “RGB”。預設值為 “UNCHANGED”。有關可用模式,請參閱
ImageReadMode。
- 返回:
解碼後的影像 (Tensor[image_channels, image_height, image_width])