torchaudio.prototype.models¶

torchaudio.prototype.models 子包包含用於處理常見音訊任務的模型定義。

注意

對於帶有預訓練引數的模型，請參考 torchaudio.prototype.pipelines 模組。

模型定義負責構建計算圖並執行它們。

有些模型結構複雜且有變體。對於此類模型，提供了工廠函式。

`ConformerWav2Vec2PretrainModel`	用於從頭開始訓練的 Conformer Wav2Vec2 預訓練模型。
`ConvEmformer`	實現了在《使用非因果卷積的流式 Transformer Transducer 語音識別》中介紹的卷積增強流式 Transformer 架構 [Shi et al., 2022]。
`HiFiGANVocoder`	HiFi GAN 的生成器部分 [Kong et al., 2020]。

Beta 模型的原型工廠函式¶

有些模型定義處於 Beta 階段，但有一些新的工廠函式仍處於原型階段。請查閱每個模型的“原型工廠函式”部分。

`Wav2Vec2Model`	wav2vec 2.0 中使用的聲學模型 [Baevski et al., 2020]。
`RNNT`	迴圈神經網路 transducer (RNN-T) 模型。