read_video¶

torchvision.io.read_video(filename: str, start_pts: Union[float, Fraction] = 0, end_pts: Optional[Union[float, Fraction]] = None, pts_unit: str = 'pts', output_format: str = 'THWC') → Tuple[Tensor, Tensor, Dict[str, Any]][source]¶

[已棄用] 從檔案中讀取影片，返回影片幀和音訊幀

警告

已棄用：自 0.22 版本起，torchvision 的所有影片解碼和編碼功能都已棄用，並將在 0.24 版本中移除。我們建議您遷移到 TorchCodec，未來 PyTorch 的解碼/編碼功能將整合到那裡。

引數：

filename (str) – 影片檔案的路徑。如果使用 pyav 後端，此引數可以是 av.open 接受的任何值。
start_pts (如果 pts_unit = 'pts'，則為 python:int；如果 pts_unit = 'sec'，則為 python:float / Fraction，可選) – 影片的起始演示時間
end_pts (如果 pts_unit = 'pts'，則為 python:int；如果 pts_unit = 'sec'，則為 python:float / Fraction，可選) – 結束演示時間
pts_unit (str, 可選) – start_pts 和 end_pts 值將被解釋的單位，可以是 ‘pts’ 或 ‘sec’。預設為 ‘pts’。
output_format (str, 可選) – 輸出影片張量的格式。可以是 “THWC”（預設）或 “TCHW”。

返回：

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])：T 個影片幀 aframes (Tensor[K, L])：音訊幀，其中 K 是通道數，L 是點數 info (Dict)：影片和音訊的元資料。可以包含 video_fps (float) 和 audio_fps (int) 欄位。

返回型別：

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])

使用 read_video 的示例

光流：使用 RAFT 模型預測運動

read_video¶

文件

教程

資源