快捷方式

torchaudio.compliance.kaldi.spectrogram

torchaudio.compliance.kaldi.spectrogram(waveform: Tensor, blackman_coeff: float = 0.42, channel: int = -1, dither: float = 0.0, energy_floor: float = 1.0, frame_length: float = 25.0, frame_shift: float = 10.0, min_duration: float = 0.0, preemphasis_coefficient: float = 0.97, raw_energy: bool = True, remove_dc_offset: bool = True, round_to_power_of_two: bool = True, sample_frequency: float = 16000.0, snip_edges: bool = True, subtract_mean: bool = False, window_type: str = 'povey') Tensor[source]

從原始音訊訊號建立語譜圖。這與 Kaldi 的 compute-spectrogram-feats 的輸入/輸出相匹配。

引數:
  • waveform (Tensor) – 音訊張量,大小為 (c, n),其中 c 在 [0,2) 範圍內

  • blackman_coeff (float, optional) – 廣義 Blackman 視窗的常係數。(預設值:0.42

  • channel (int, optional) – 要提取的通道(-1 -> 期望單聲道,0 -> 左聲道,1 -> 右聲道)(預設值:-1

  • dither (float, optional) – 抖動常數(0.0 表示無抖動)。如果您關閉此選項,則應設定 energy_floor 選項,例如設定為 1.0 或 0.1(預設值:0.0

  • energy_floor (float, optional) – 語譜圖計算中的能量下限(絕對值,非相對值)。注意:此下限應用於零分量,代表總訊號能量。單個語譜圖元素的下限固定為 std::numeric_limits<float>::epsilon()。(預設值:1.0

  • frame_length (float, optional) – 幀長(毫秒)(預設值:25.0

  • frame_shift (float, optional) – 幀移(毫秒)(預設值:10.0

  • min_duration (float, optional) – 要處理的最小段持續時間(秒)。(預設值:0.0

  • preemphasis_coefficient (float, optional) – 用於訊號預加重的係數(預設值:0.97

  • raw_energy (bool, optional) – 如果為 True,則在預加重和加窗之前計算能量(預設值:True

  • remove_dc_offset (bool, optional) – 從每幀波形中減去均值(預設值:True

  • round_to_power_of_two (bool, optional) – 如果為 True,則透過對 FFT 輸入進行零填充,將視窗大小向上取整到最接近的二次冪。(預設值:True

  • sample_frequency (float, optional) – 波形資料取樣頻率(必須與波形檔案中的指定值匹配)(預設值:16000.0

  • snip_edges (bool, optional) – 如果為 True,則僅輸出完全適合檔案中的幀,以處理端部效應,且幀數取決於 frame_length。如果為 False,則幀數僅取決於 frame_shift,並在末端反射資料。(預設值:True

  • subtract_mean (bool, optional) – 減去每個特徵檔案的均值 [CMS];不建議採用這種方式。(預設值:False

  • window_type (str, optional) – 視窗型別(‘hamming’|’hanning’|’povey’|’rectangular’|’blackman’)(預設值:'povey'

返回:

與 Kaldi 輸出的語譜圖完全相同。形狀為 (m, padded_window_size // 2 + 1),其中 m 在 _get_strided 中計算得出

返回型別:

Tensor

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源