快捷方式

torchaudio.save

torchaudio.save(uri: Union[BinaryIO, str, PathLike], src: Tensor, sample_rate: int, channels_first: bool = True, format: Optional[str] = None, encoding: Optional[str] = None, bits_per_sample: Optional[int] = None, buffer_size: int = 4096, backend: Optional[str] = None, compression: Optional[Union[CodecConfig, float,int]] = None)

將音訊資料儲存到檔案。

注意

此函式可處理的格式取決於後端的可用性。請使用以下函式獲取支援的格式。

引數:
  • uri (strpathlib.Path) – 音訊檔案路徑。

  • src (torch.Tensor) – 要儲存的音訊資料。必須是二維張量。

  • sample_rate (int) – 取樣率

  • channels_first (bool, 可選) – 如果為 True,則給定張量解釋為 [通道, 時間],否則解釋為 [時間, 通道]

  • format (strNone, 可選) –

    覆蓋音訊格式。當 uri 引數是類似路徑的物件時,音訊格式會從副檔名推斷。如果副檔名缺失或不同,可以使用此引數指定正確的格式。

    uri 引數是類似檔案的物件時,此引數是必需的。

    有效值包括 "wav""ogg""flac"

  • encoding (strNone, 可選) –

    更改受支援格式的編碼。此引數僅對受支援的格式有效,即 "wav""flac"。有效值包括

    • "PCM_S" (帶符號整數線性 PCM)

    • "PCM_U" (無符號整數線性 PCM)

    • "PCM_F" (浮點 PCM)

    • "ULAW" (mu-law)

    • "ALAW" (a-law)

  • bits_per_sample (intNone, 可選) – 更改受支援格式的位深度。當 format"wav""flac" 時,可以更改位深度。有效值包括 816243264

  • buffer_size (int, 可選) – 處理類似檔案物件時使用的緩衝區大小,以位元組為單位。(預設值:4096

  • backend (strNone, 可選) –

    要使用的 I/O 後端。如果為 None,函式將根據輸入和可用後端選擇後端。否則,必須是 ["ffmpeg", "sox", "soundfile"] 之一,且相應的後端必須可用。(預設值:None

    另請參閱

    後端和排程器

  • compression (CodecConfig, float, int, 或 None, 可選) –

    要應用的壓縮配置。

    如果選擇的後端是 FFmpeg,則必須提供 CodecConfig 的例項。

    否則,如果選擇的後端是 SoX,則必須提供對應於 sox 命令列介面選項 -C 的浮點或整數值。例如:

    "mp3"

    可以是帶有質量因子的位元率(以 kbps 為單位),例如 128.2,也可以是帶有質量因子的 VBR 編碼,例如 -4.2。預設值:-4.5

    "flac"

    08 的整數。8 是預設值和最高壓縮率。

    "ogg", "vorbis"

    -110 的數字;-1 是最高壓縮率和最低質量。預設值:3

    有關更多詳細資訊,請參閱http://sox.sourceforge.net/soxformat.html

使用 save 的教程
Audio I/O

音訊 I/O

音訊 I/O

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源