目錄

快捷方式

PSD¶

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]¶

計算跨通道功率譜密度（PSD）矩陣。

引數：

multi_mask (bool, 可選) – 如果為 True，則僅接受多通道時頻掩碼。(預設值: False)
normalize (bool, 可選) – 如果為 True，則沿時間維度標準化掩碼。(預設值: True)
eps (float, 可選) – 新增到掩碼標準化分母中的值。(預設值: 1e-15)

使用 PSD 的教程: 使用 MVDR 波束形成進行語音增強

使用 MVDR 波束形成進行語音增強

forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]¶

引數：

specgram (torch.Tensor) – 多通道複數值頻譜。張量維度為 (…, 通道, 頻率, 時間)。
mask (torch.Tensor 或 None, 可選) – 用於標準化的時頻掩碼。如果 multi_mask 為 False，則張量維度為 (…, 頻率, 時間)；如果 multi_mask 為 True，則張量維度為 (…, 通道, 頻率, 時間)。(預設值: None)

返回：

輸入頻譜的複數值 PSD 矩陣。: 張量維度為 (…, 頻率, 通道, 通道)

返回型別：

文件

查閱 PyTorch 的完整開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源