TimeStretch¶
- class torchaudio.transforms.TimeStretch(hop_length: Optional[int] = None, n_freq: int = 201, fixed_rate: Optional[float] = None)[源]¶
以給定速率拉伸時域短時傅立葉變換 (stft),不改變音高。
提出於 SpecAugment [Park 等人, 2019]。
- 引數:
注意
期望的輸入是原始的、複數值的頻譜圖。
- 示例
>>> spectrogram = torchaudio.transforms.Spectrogram(power=None) >>> stretch = torchaudio.transforms.TimeStretch() >>> >>> original = spectrogram(waveform) >>> stretched_1_2 = stretch(original, 1.2) >>> stretched_0_9 = stretch(original, 0.9)
- 使用
TimeStretch的教程
- forward(complex_specgrams: Tensor, overriding_rate: Optional[float] = None) Tensor[源]¶
- 引數:
complex_specgrams (Tensor) – 一個維度為 (…, freq, num_frame) 且 dtype 為複數的張量。
overriding_rate (float 或 None, 可選) – 應用於此批次的加速速率。如果未傳遞速率,則使用
self.fixed_rate。(預設值:None)
- 返回值:
拉伸後的頻譜圖。結果張量的複數 dtype 與輸入頻譜圖對應,幀數變為
ceil(num_frame / rate)。- 返回型別:
Tensor