快捷方式

SquimSubjective

class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[source]

語音質量和可懂度評估 (SQUIM) 模型,用於預測用於語音增強的主觀指標得分(例如,平均主觀意見分數 (MOS))。該模型改編自 NORESQA-MOS [Manocha and Kumar, 2022],它根據輸入語音和非匹配參考預測 MOS 分數。

引數:
使用 SquimSubjective 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:Torchaudio 中的非侵入式語音評估

Torchaudio-Squim:Torchaudio 中的非侵入式語音評估

方法

forward

SquimSubjective.forward(waveform: Tensor, reference: Tensor)[source]

預測主觀評估指標得分。

引數:
  • waveform (torch.Tensor) – 用於評估的輸入波形。維度為 (batch, time) 的 Tensor。

  • reference (torch.Tensor) – 非匹配的乾淨參考。維度為 (batch, time_ref) 的 Tensor。

返回:

主觀指標得分。維度為 (batch,) 的 Tensor。

返回型別:

(torch.Tensor)

工廠函式

squim_subjective_model

構建一個自定義的 torchaudio.prototype.models.SquimSubjective 模型。

squim_subjective_base

使用預設引數構建 torchaudio.prototype.models.SquimSubjective 模型。

文件

訪問 PyTorch 的完整開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲取問題解答

檢視資源