快捷方式

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]

計算跨通道功率譜密度(PSD)矩陣。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
引數:
  • multi_mask (bool, 可選) – 如果為 True,則僅接受多通道時頻掩碼。(預設值: False)

  • normalize (bool, 可選) – 如果為 True,則沿時間維度標準化掩碼。(預設值: True)

  • eps (float, 可選) – 新增到掩碼標準化分母中的值。(預設值: 1e-15)

使用 PSD 的教程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束形成進行語音增強

使用 MVDR 波束形成進行語音增強
forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]
引數:
  • specgram (torch.Tensor) – 多通道複數值頻譜。張量維度為 (…, 通道, 頻率, 時間)

  • mask (torch.TensorNone, 可選) – 用於標準化的時頻掩碼。如果 multi_mask 為 False,則張量維度為 (…, 頻率, 時間);如果 multi_mask 為 True,則張量維度為 (…, 通道, 頻率, 時間)。(預設值: None)

返回:

輸入頻譜的複數值 PSD 矩陣。

張量維度為 (…, 頻率, 通道, 通道)

返回型別:

torch.Tensor

文件

查閱 PyTorch 的完整開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源