SquimSubjective¶
- class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[source]¶
語音質量和可懂度評估 (SQUIM) 模型,用於預測用於語音增強的主觀指標得分(例如,平均主觀意見分數 (MOS))。該模型改編自 NORESQA-MOS [Manocha and Kumar, 2022],它根據輸入語音和非匹配參考預測 MOS 分數。
- 引數:
ssl_model (torch.nn.Module) – 用於特徵提取的自監督學習模型。
projector (torch.nn.Module) – 將 SSL 特徵投影到較低維度的投影層。
predictor (torch.nn.Module) – 預測主觀得分。
- 使用
SquimSubjective的教程
方法¶
forward¶
- SquimSubjective.forward(waveform: Tensor, reference: Tensor)[source]¶
預測主觀評估指標得分。
- 引數:
waveform (torch.Tensor) – 用於評估的輸入波形。維度為 (batch, time) 的 Tensor。
reference (torch.Tensor) – 非匹配的乾淨參考。維度為 (batch, time_ref) 的 Tensor。
- 返回:
主觀指標得分。維度為 (batch,) 的 Tensor。
- 返回型別:
工廠函式¶
構建一個自定義的 |
|
使用預設引數構建 |