torchaudio.models.wavlm_model¶

torchaudio.models.wavlm_model(extractor_mode: str, extractor_conv_layer_config: Optional[List[Tuple[int, int, int]]], extractor_conv_bias: bool, encoder_embed_dim: int, encoder_projection_dropout: float, encoder_pos_conv_kernel: int, encoder_pos_conv_groups: int, encoder_num_layers: int, encoder_num_heads: int, encoder_num_buckets: int, encoder_max_distance: int, encoder_attention_dropout: float, encoder_ff_interm_features: int, encoder_ff_interm_dropout: float, encoder_dropout: float, encoder_layer_norm_first: bool, encoder_layer_drop: float, aux_num_out: Optional[int]) → Wav2Vec2Model[原始碼]¶

構建自定義 WaveLM 模型 [Chen 等., 2022]。該架構與 Wav2Vec2 模型 [Baevski 等., 2020] 相容，因此輸出物件是 Wav2Vec2Model。大多數引數的含義與 wav2vec2_model() 中的含義相同，請參考該處獲取文件。

引數：

extractor_mode (str) – 特徵提取器的操作模式。請參閱 wav2vec2_model()。
extractor_conv_layer_config (整數元組列表或None) – 請參閱 wav2vec2_model()。
extractor_conv_bias (bool) – 請參閱 wav2vec2_model()。
encoder_embed_dim (int) – 請參閱 wav2vec2_model()。
encoder_projection_dropout (float) – 請參閱 wav2vec2_model()。
encoder_pos_conv_kernel (int) – 請參閱 wav2vec2_model()。
encoder_pos_conv_groups (int) – 請參閱 wav2vec2_model()。
encoder_num_layers (int) – 請參閱 wav2vec2_model()。
encoder_num_heads (int) – 請參閱 wav2vec2_model()。
encoder_num_buckets (int) – 相對位置嵌入的桶數。
encoder_max_distance (int) – 相對位置嵌入的最大距離。
encoder_attention_dropout (float) – 請參閱 wav2vec2_model()。
encoder_ff_interm_features (int) – 請參閱 wav2vec2_model()。
encoder_ff_interm_dropout (float) – 請參閱 wav2vec2_model()。
encoder_dropout (float) – 請參閱 wav2vec2_model()。
encoder_layer_norm_first (bool) – 請參閱 wav2vec2_model()。
encoder_layer_drop (float) – 請參閱 wav2vec2_model()。
aux_num_out (int或None) – 請參閱 wav2vec2_model()。

返回：

結果模型。

返回型別：

Wav2Vec2Model

torchaudio.models.wavlm_model¶

文件

教程

資源