torchaudio.save¶
- torchaudio.save(uri: Union[BinaryIO, str, PathLike], src: Tensor, sample_rate: int, channels_first: bool = True, format: Optional[str] = None, encoding: Optional[str] = None, bits_per_sample: Optional[int] = None, buffer_size: int = 4096, backend: Optional[str] = None, compression: Optional[Union[CodecConfig, float,int]] = None)¶
將音訊資料儲存到檔案。
- 引數:
uri (str 或 pathlib.Path) – 音訊檔案路徑。
src (torch.Tensor) – 要儲存的音訊資料。必須是二維張量。
sample_rate (int) – 取樣率
channels_first (bool, 可選) – 如果為
True,則給定張量解釋為 [通道, 時間],否則解釋為 [時間, 通道]。format (str 或 None, 可選) –
覆蓋音訊格式。當
uri引數是類似路徑的物件時,音訊格式會從副檔名推斷。如果副檔名缺失或不同,可以使用此引數指定正確的格式。當
uri引數是類似檔案的物件時,此引數是必需的。有效值包括
"wav"、"ogg"和"flac"。encoding (str 或 None, 可選) –
更改受支援格式的編碼。此引數僅對受支援的格式有效,即
"wav"和"flac"。有效值包括"PCM_S"(帶符號整數線性 PCM)"PCM_U"(無符號整數線性 PCM)"PCM_F"(浮點 PCM)"ULAW"(mu-law)"ALAW"(a-law)
bits_per_sample (int 或 None, 可選) – 更改受支援格式的位深度。當
format為"wav"或"flac"時,可以更改位深度。有效值包括8、16、24、32和64。buffer_size (int, 可選) – 處理類似檔案物件時使用的緩衝區大小,以位元組為單位。(預設值:
4096)backend (str 或 None, 可選) –
要使用的 I/O 後端。如果為
None,函式將根據輸入和可用後端選擇後端。否則,必須是 ["ffmpeg","sox","soundfile"] 之一,且相應的後端必須可用。(預設值:None)另請參閱
compression (CodecConfig, float, int, 或 None, 可選) –
要應用的壓縮配置。
如果選擇的後端是 FFmpeg,則必須提供
CodecConfig的例項。否則,如果選擇的後端是 SoX,則必須提供對應於
sox命令列介面選項-C的浮點或整數值。例如:"mp3"可以是帶有質量因子的位元率(以
kbps為單位),例如128.2,也可以是帶有質量因子的 VBR 編碼,例如-4.2。預設值:-4.5。"flac"從
0到8的整數。8是預設值和最高壓縮率。"ogg","vorbis"從
-1到10的數字;-1是最高壓縮率和最低質量。預設值:3。
有關更多詳細資訊,請參閱http://sox.sourceforge.net/soxformat.html。
- 使用
save的教程