快捷方式

SquimObjective

class torchaudio.models.SquimObjective(encoder: Module, dprnn: Module, branches: ModuleList)[source]

語音質量和可懂度度量 (SQUIM) 模型,用於預測語音增強的客觀指標得分(例如,STOI、PESQ 和 SI-SDR)。

引數:
  • encoder (torch.nn.Module) – 用於將 1D 波形轉換為 2D 特徵表示的編碼器模組。

  • dprnn (torch.nn.Module) – 用於建模序列特徵的 DPRNN 模組。

  • branches (torch.nn.ModuleList) – Transformer 分支,每個分支估計一個客觀指標得分。

使用 SquimObjective 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式語音評估

Torchaudio-Squim:TorchAudio 中的非侵入式語音評估

方法

forward

SquimObjective.forward(x: Tensor) List[Tensor][source]
引數:

x (torch.Tensor) – 輸入波形。維度為 (batch, time) 的張量。

返回值:

得分張量列表。每個張量的維度為 (batch,)

返回型別:

List(torch.Tensor)

工廠函式

squim_objective_model

構建自定義的 torchaudio.prototype.models.SquimObjective 模型。

squim_objective_base

使用預設引數構建 torchaudio.prototype.models.SquimObjective 模型。

文件

查閱 PyTorch 開發者完整文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲取解答

檢視資源