torchaudio.prototype.models¶
torchaudio.prototype.models 子包包含用於處理常見音訊任務的模型定義。
注意
對於帶有預訓練引數的模型,請參考 torchaudio.prototype.pipelines 模組。
模型定義負責構建計算圖並執行它們。
有些模型結構複雜且有變體。對於此類模型,提供了工廠函式。
用於從頭開始訓練的 Conformer Wav2Vec2 預訓練模型。 |
|
實現了在《使用非因果卷積的流式 Transformer Transducer 語音識別》中介紹的卷積增強流式 Transformer 架構 [Shi et al., 2022]。 |
|
HiFi GAN 的生成器部分 [Kong et al., 2020]。 |
Beta 模型的原型工廠函式¶
有些模型定義處於 Beta 階段,但有一些新的工廠函式仍處於原型階段。請查閱每個模型的“原型工廠函式”部分。
wav2vec 2.0 中使用的聲學模型 [Baevski et al., 2020]。 |
|
迴圈神經網路 transducer (RNN-T) 模型。 |