快捷方式

torchaudio.functional.inverse_spectrogram

torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor[原始碼]

從提供的複數值譜圖建立逆譜圖或一批逆譜圖。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
引數:
  • spectrogram (Tensor) – 維度為 (…, freq, time) 的音訊複數張量。

  • length (int or None) – 輸出波形的長度。

  • pad (int) – 訊號的兩側填充。僅在提供 length 時有效。

  • window (Tensor) – 應用/乘以每個幀/視窗的視窗張量。

  • n_fft (int) – FFT 大小。

  • hop_length (int) – STFT 視窗之間的跳躍長度。

  • win_length (int) – 視窗大小。

  • normalized (bool or str) – STFT 輸出是否按幅度歸一化。如果輸入是字串,選項為 "window""frame_length",取決於歸一化模式。True 對映到 "window"

  • center (bool, optional) – 波形是否在兩側進行了填充,使得第 \(t\) 幀以時間 \(t \times \text{hop\_length}\) 為中心。預設值:True

  • pad_mode (string, optional) – 控制當 centerTrue 時使用的填充方法。提供此引數是為了與 spectrogram 函式相容,但實際並未使用。預設值:"reflect"

  • onesided (bool, optional) – 控制譜圖是否採用單邊模式。預設值:True

返回:

維度 (…, time)。原始訊號的最小二乘估計。

返回型別:

Tensor


© 版權所有 2024, Torchaudio 貢獻者。

使用 Sphinx 構建,主題由 Read the Docs 提供。

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並解答你的問題

檢視資源