torchaudio.functional.inverse_spectrogram¶

torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) → Tensor[原始碼]¶

從提供的複數值譜圖建立逆譜圖或一批逆譜圖。

引數:

spectrogram (Tensor) – 維度為 (…, freq, time) 的音訊複數張量。
length (int or None) – 輸出波形的長度。
pad (int) – 訊號的兩側填充。僅在提供 length 時有效。
window (Tensor) – 應用/乘以每個幀/視窗的視窗張量。
n_fft (int) – FFT 大小。
hop_length (int) – STFT 視窗之間的跳躍長度。
win_length (int) – 視窗大小。
normalized (bool or str) – STFT 輸出是否按幅度歸一化。如果輸入是字串，選項為 "window" 和 "frame_length"，取決於歸一化模式。True 對映到 "window"。
center (bool, optional) – 波形是否在兩側進行了填充，使得第 \(t\) 幀以時間 \(t \times \text{hop\_length}\) 為中心。預設值：True。
pad_mode (string, optional) – 控制當 center 為 True 時使用的填充方法。提供此引數是為了與 spectrogram 函式相容，但實際並未使用。預設值："reflect"。
onesided (bool, optional) – 控制譜圖是否採用單邊模式。預設值：True。

返回:

維度 (…, time)。原始訊號的最小二乘估計。

返回型別:

Tensor

文件