快捷方式

write_video

torchvision.io.write_video(filename: str, video_array: Tensor, fps: float, video_codec: str = 'libx264', options: Optional[Dict[str, Any]] = None, audio_array: Optional[Tensor] = None, audio_fps: Optional[float] = None, audio_codec: Optional[str] = None, audio_options: Optional[Dict[str, Any]] = None) None[source]

[已棄用] 將 [T, H, W, C] 格式的 4d 張量寫入影片檔案。

警告

已棄用:Torchvision 的所有影片解碼和編碼功能從 0.22 版本開始棄用,並將在 0.24 版本中移除。我們建議您遷移到 TorchCodec,未來 PyTorch 的解碼/編碼功能將整合在那裡。

此函式依賴於 PyAV(因此最終依賴於 FFmpeg)進行影片編碼,您可以參考 FFMpeg wiki 中可用的其他選項來獲得更精細的控制。

引數:
  • filename (str) – 影片將儲存的路徑

  • video_array (Tensor[T, H, W, C]) – 包含單個幀的張量,為 [T, H, W, C] 格式的 uint8 張量

  • fps (Number) – 影片每秒幀數

  • video_codec (str) – 影片編解碼器的名稱,例如 “libx264”, “h264” 等。

  • options (Dict) –

    包含要傳遞給 PyAV 影片流的選項的字典。選項列表取決於編解碼器,全部可以在 FFMpeg wiki 中找到。

  • audio_array (Tensor[C, N]) – 包含音訊的張量,其中 C 是通道數,N 是樣本數

  • audio_fps (Number) – 音訊取樣率,通常為 44100 或 48000

  • audio_codec (str) – 音訊編解碼器的名稱,例如 “mp3”, “aac” 等。

  • audio_options (Dict) –

    包含要傳遞給 PyAV 音訊流的選項的字典。選項列表取決於編解碼器,全部可以在 FFMpeg wiki 中找到。

示例:
>>> # Creating libx264 video with CRF 17, for visually lossless footage:
>>>
>>> from torchvision.io import write_video
>>> # 1000 frames of 100x100, 3-channel image.
>>> vid = torch.randn(1000, 100, 100, 3, dtype = torch.uint8)
>>> write_video("video.mp4", options = {"crf": "17"})

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得解答

檢視資源