EMFORMER_RNNT_BASE_TEDLIUM3¶
- torchaudio.prototype.pipelines.EMFORMER_RNNT_BASE_TEDLIUM3¶
預訓練的基於 Emformer-RNNT 的 ASR pipeline,能夠執行流式和非流式推理。
底層模型由
torchaudio.models.emformer_rnnt_base()構建,並利用在 TED-LIUM Release 3 [Rousseau 等人, 2012] 資料集上使用train.py訓練指令碼(此處)以及num_symbols=501訓練的權重。有關使用說明,請參考
torchaudio.pipelines.RNNTBundle。