快捷方式

torchaudio.functional.resample

torchaudio.functional.resample(waveform: Tensor, orig_freq: int, new_freq: int, lowpass_filter_width: int = 6, rolloff: float = 0.99, resampling_method: str = 'sinc_interp_hann', beta: Optional[float] = None) Tensor[source]

使用帶限插值將波形重取樣到新頻率。 [Smith, 2020]

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

注意

transforms.Resample 會預先計算並重用重取樣核,因此如果使用相同的重取樣引數重取樣多個波形,使用它會產生更高效的計算。

引數:
  • waveform (Tensor) – 輸入訊號,維度為 (…, time)

  • orig_freq (int) – 訊號的原始頻率

  • new_freq (int) – 所需頻率

  • lowpass_filter_width (int, 可選) – 控制濾波器的銳度,越大越銳利但效率越低。(預設值: 6)

  • rolloff (float, 可選) – 濾波器的滾降頻率,作為奈奎斯特頻率的一部分。值越低越減少抗鋸齒,但也會削弱一些最高頻率。(預設值: 0.99)

  • resampling_method (str, 可選) – 要使用的重取樣方法。選項:["sinc_interp_hann", "sinc_interp_kaiser"] (預設值: "sinc_interp_hann")

  • beta (floatNone, 可選) – 用於 kaiser 窗的形狀引數。

返回:

新頻率下的波形,維度為 (…, time)。

返回型別:

Tensor

使用 resample 的教程
Speech Recognition with Wav2Vec2

使用 Wav2Vec2 進行語音識別

使用 Wav2Vec2 進行語音識別
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式語音評估

Torchaudio-Squim:TorchAudio 中的非侵入式語音評估
Audio Feature Extractions

音訊特徵提取

音訊特徵提取
ASR Inference with CTC Decoder

使用 CTC 解碼器進行 ASR 推理

使用 CTC 解碼器進行 ASR 推理
Audio Resampling

音訊重取樣

音訊重取樣

文件

訪問 PyTorch 的綜合開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源