WAVLM_BASE_PLUS¶
- torchaudio.pipelines.WAVLM_BASE_PLUS¶
WavLM Base+ 模型(“基礎”架構),在 Libri-Light 資料集 [Kahn 等人,2020] 的 60,000 小時資料、GigaSpeech [Chen 等人,2021] 的 10,000 小時資料以及 VoxPopuli [Wang 等人,2021] 的 24,000 小時資料上預訓練,未進行微調。
最初由 WavLM 的作者 [Chen 等人,2022] 在 MIT 許可下發布,並以相同許可重新分發。 [許可, 來源]
請參考
torchaudio.pipelines.Wav2Vec2Bundle檢視用法。