快捷方式

torchaudio.prototype.models.emformer_hubert_base

torchaudio.prototype.models.emformer_hubert_base(extractor_input_dim: int = 80, extractor_output_dim: int = 128, encoder_dropout: float = 0.1, aux_num_out: Optional[int] = None) Wav2Vec2Model[原始碼]

構建具有 20 個 Emformer 層的 Emformer HuBERT 模型。

引數
  • extractor_input_dim (int, 可選) – 特徵提取器的輸入維度。(預設值:80)

  • extractor_output_dim (int, 可選) – 特徵提取器後的輸出維度。(預設值:128)

  • encoder_dropout (float, 可選) – Emformer 中的 Dropout 機率。(預設值:0.1)

  • aux_num_out (intNone, 可選) – 用於微調的輔助層的輸出維度。(預設值:None)

返回

結果 torchaudio.models.Wav2Vec2Model 模型,包含一個 torchaudio.models.Emformer 編碼器。

返回型別

Wav2Vec2Model

文件

訪問 PyTorch 全面的開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源