快捷方式

TimeStretch

class torchaudio.transforms.TimeStretch(hop_length: Optional[int] = None, n_freq: int = 201, fixed_rate: Optional[float] = None)[源]

以給定速率拉伸時域短時傅立葉變換 (stft),不改變音高。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

提出於 SpecAugment [Park 等人, 2019]

引數:
  • hop_length (intNone, 可選) – STFT 視窗之間的跳躍長度。(預設值:n_fft // 2,其中 n_fft == (n_freq - 1) * 2

  • n_freq (int, 可選) – 來自 stft 的濾波器組數量。(預設值:201

  • fixed_rate (floatNone, 可選) – 應用於加速或減速的速率。如果提供 None,則必須將 rate 傳遞給 forward 方法。(預設值:None

注意

期望的輸入是原始的、複數值的頻譜圖。

示例
>>> spectrogram = torchaudio.transforms.Spectrogram(power=None)
>>> stretch = torchaudio.transforms.TimeStretch()
>>>
>>> original = spectrogram(waveform)
>>> stretched_1_2 = stretch(original, 1.2)
>>> stretched_0_9 = stretch(original, 0.9)
The visualization of stretched spectrograms.
使用 TimeStretch 的教程
Audio Feature Augmentation

音訊特徵增強

音訊特徵增強
forward(complex_specgrams: Tensor, overriding_rate: Optional[float] = None) Tensor[源]
引數:
  • complex_specgrams (Tensor) – 一個維度為 (…, freq, num_frame) 且 dtype 為複數的張量。

  • overriding_rate (floatNone, 可選) – 應用於此批次的加速速率。如果未傳遞速率,則使用 self.fixed_rate。(預設值:None

返回值:

拉伸後的頻譜圖。結果張量的複數 dtype 與輸入頻譜圖對應,幀數變為 ceil(num_frame / rate)

返回型別:

Tensor

文件

查閱 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源