快捷方式

時間掩碼

class torchaudio.transforms.TimeMasking(time_mask_param: int, iid_masks: bool = False, p: float = 1.0)[原始碼]

對頻譜圖應用時域掩蔽。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

SpecAugment 中提出 [Park , 2019]

引數:
  • time_mask_param (int) – 掩碼的最大可能長度。索引從 [0, time_mask_param) 中均勻取樣。

  • iid_masks (bool, 可選) – 是否對批次中的每個樣本/通道應用不同的掩碼。(預設值: False) 此選項僅適用於輸入張量維度 >= 3 的情況。

  • p (float, 可選) – 可被掩蔽的時間步的最大比例。必須在 [0.0, 1.0] 範圍內。(預設值: 1.0)

示例
>>> spectrogram = torchaudio.transforms.Spectrogram()
>>> masking = torchaudio.transforms.TimeMasking(time_mask_param=80)
>>>
>>> original = spectrogram(waveform)
>>> masked = masking(original)
The original spectrogram The spectrogram masked along time axis
使用 TimeMasking 的教程
Audio Feature Augmentation

音訊特徵增強

音訊特徵增強

© 版權所有 2024, Torchaudio 貢獻者。

使用 Sphinx 構建,主題由 Read the Docs 提供。

文件

查閱 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源