torchaudio.info¶
- torchaudio.info(uri: Union[BinaryIO, str,PathLike], format: Optional[str] = None, buffer_size: int = 4096, backend: Optional[str] = None) AudioMetaData¶
獲取音訊檔案的訊號資訊。
注意
當輸入型別為 file-like object 時,此函式無法獲取某些格式(例如 vorbis)的正確長度 (num_samples)。在這種情況下,num_samples 的值為 0。
- 引數:
uri (path-like object 或 file-like object) –
音訊資料來源。接受以下型別:
path-like: 檔案路徑或 URL。file-like: 具有read(size: int) -> bytes方法的物件,該方法返回最多size長度的位元組字串。
format (str 或 None,可選) – 如果不是
None,則解釋為一個提示,可能允許後端覆蓋檢測到的格式。(預設值:None)buffer_size (int,可選) – 處理 file-like object 時使用的緩衝區大小,以位元組為單位。(預設值:
4096)backend (str 或 None,可選) –
要使用的 I/O 後端。如果為
None,函式將根據輸入和可用後端選擇後端。否則,必須是 ["ffmpeg","sox","soundfile"] 之一,且相應的後端可用。(預設值:None)另請參閱
- 返回:
AudioMetaData
- 使用
info的教程
支援結構¶
AudioMetaData¶
- class torchaudio.AudioMetaData[source]¶
torchaudio.info 函式的返回型別。
- 變數:
sample_rate (int) – 取樣率
num_frames (int) – 幀數
num_channels (int) – 聲道數
bits_per_sample (int) – 每樣本的位數。對於有損格式或無法準確推斷時,此值為 0。
encoding (str) –
音訊編碼 encoding 的可能取值如下:
PCM_S: 有符號整數線性 PCMPCM_U: 無符號整數線性 PCMPCM_F: 浮點線性 PCMFLAC: Flac,自由無損音訊編碼ULAW: Mu-lawALAW: A-lawMP3: MP3,MPEG-1 Audio Layer IIIVORBIS: OGG VorbisAMR_WB: 自適應多速率寬頻AMR_NB: 自適應多速率窄帶OPUS: OpusHTK: 單聲道 16 位 PCMUNKNOWN: 上述都不是
- 使用 AudioMetaData 的教程