快捷方式

torchaudio.prototype.models.conformer_wav2vec2_base

torchaudio.prototype.models.conformer_wav2vec2_base(extractor_input_dim: int = 64, extractor_output_dim: int = 256, encoder_projection_dropout: float = 0.0) Wav2Vec2Model[source]

構建具有“小型”架構的 Conformer Wav2Vec2 模型,出自 Conformer-Based Slef-Supervised Learning for Non-Speech Audio Tasks [Srivastava 等人,2022]]

引數:
  • extractor_input_dim (int, 可選) – 特徵提取器的輸入維度。(預設值: 64)

  • extractor_output_dim (int, 可選) – 特徵提取器的輸出維度。(預設值: 256)

  • encoder_projection_dropout (float, 可選) – 特徵投影后應用的 Dropout 機率。(預設值: 0.0)

返回值:

結果是具有 Conformer 編碼器和 base 配置的 wav2vec2 模型。

返回型別:

Wav2Vec2Model

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源