快捷方式

decode_png

torchvision.io.decode_png(input: Tensor, mode: ImageReadMode = ImageReadMode.UNCHANGED, apply_exif_orientation: bool = False) Tensor[原始碼]

將 PNG 影像解碼為 3 維 RGB 或灰度 Tensor。

在大多數情況下,輸出 tensor 的值範圍是 uint8 [0, 255]。如果影像是 16 位 PNG,則輸出 tensor 的值範圍是 uint16 [0, 65535](從 torchvision 0.21 開始支援)。由於 PyTorch 中對 uint16 的支援有限,我們建議在此函式之後呼叫 torchvision.transforms.v2.functional.to_dtype() 並設定 scale=True,以便將解碼後的影像轉換為 uint8 或 float tensor。

引數:
  • input (Tensor[1]) – 包含 PNG 影像原始位元組的一維 uint8 tensor。

  • mode (strImageReadMode) – 將影像轉換為的模式,例如 “RGB”。預設為 “UNCHANGED”。有關可用模式,請參見 ImageReadMode

  • apply_exif_orientation (bool) – 對輸出 tensor 應用 EXIF 方向變換。預設為 False。

返回:

輸出 (Tensor[image_channels, image_height, image_width])

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源