快捷方式

torchaudio.prototype.models

torchaudio.prototype.models 子包包含用於處理常見音訊任務的模型定義。

注意

對於帶有預訓練引數的模型,請參考 torchaudio.prototype.pipelines 模組。

模型定義負責構建計算圖並執行它們。

有些模型結構複雜且有變體。對於此類模型,提供了工廠函式。

ConformerWav2Vec2PretrainModel

用於從頭開始訓練的 Conformer Wav2Vec2 預訓練模型。

ConvEmformer

實現了在《使用非因果卷積的流式 Transformer Transducer 語音識別》中介紹的卷積增強流式 Transformer 架構 [Shi et al., 2022]

HiFiGANVocoder

HiFi GAN 的生成器部分 [Kong et al., 2020]

Beta 模型的原型工廠函式

有些模型定義處於 Beta 階段,但有一些新的工廠函式仍處於原型階段。請查閱每個模型的“原型工廠函式”部分。

Wav2Vec2Model

wav2vec 2.0 中使用的聲學模型 [Baevski et al., 2020]

RNNT

迴圈神經網路 transducer (RNN-T) 模型。

文件

訪問 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源