快捷方式

torchaudio.functional.add_noise

torchaudio.functional.add_noise(waveform: Tensor, noise: Tensor, snr: Tensor, lengths: Optional[Tensor] = None) Tensor[原始碼]

根據信噪比縮放並向波形新增噪聲。

具體來說,對於每一對波形向量 \(x \in \mathbb{R}^L\) 和噪聲向量 \(n \in \mathbb{R}^L\),函式計算輸出 \(y\)

\[y = x + a n \, \text{,} \]

其中

\[a = \sqrt{ \frac{ ||x||_{2}^{2} }{ ||n||_{2}^{2} } \cdot 10^{-\frac{\text{SNR}}{10}} } \, \text{,} \]

其中 \(\text{SNR}\)\(x\)\(n\) 之間期望的信噪比(單位:dB)。

請注意,此函式在輸入中廣播單例前導維度,其方式與上述公式和 PyTorch 的廣播語義一致。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
引數:
  • waveform (torch.Tensor) – 輸入波形,形狀為 \((…, L)\)。

  • noise (torch.Tensor) – 噪聲,形狀為 \((…, L)\)(與 waveform 形狀相同)。

  • snr (torch.Tensor) – 信噪比(單位:dB),形狀為 \((…,)\)。

  • lengths (torch.TensorNone, 可選) – waveformnoise 中訊號的有效長度,形狀為 \((…,)\)(前導維度必須與 waveform 匹配)。如果為 None,則 waveformnoise 中的所有元素都被視為有效。(預設值:None

返回:

noise 縮放後新增到 waveform 的結果,形狀為 \((…, L)\)(與 waveform 形狀相同)。

返回型別:

torch.Tensor

使用 add_noise 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim: TorchAudio 中的非侵入式語音評估

Torchaudio-Squim: TorchAudio 中的非侵入式語音評估
Audio Data Augmentation

音訊資料增強

音訊資料增強

文件

訪問 PyTorch 完整的開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源