快捷方式

FrequencyMasking

class torchaudio.transforms.FrequencyMasking(freq_mask_param: int, iid_masks: bool = False)[source]

在頻譜圖的頻率域應用掩蔽。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

SpecAugment [Park 等人, 2019] 中提出。

引數:
  • freq_mask_param (int) – 掩蔽的最大可能長度。索引從 [0, freq_mask_param) 均勻取樣。

  • iid_masks (bool, 可選) – 是否對批處理中的每個樣本/通道應用不同的掩蔽。(預設值:False)此選項僅適用於輸入張量 >= 3D 的情況。

示例
>>> spectrogram = torchaudio.transforms.Spectrogram()
>>> masking = torchaudio.transforms.FrequencyMasking(freq_mask_param=80)
>>>
>>> original = spectrogram(waveform)
>>> masked = masking(original)
The original spectrogram The spectrogram masked along frequency axis
使用 FrequencyMasking 的教程
Audio Feature Augmentation

音訊特徵增強

音訊特徵增強

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源