MMS_FA¶
- torchaudio.pipelines.MMS_FA¶
基於來自 Scaling Speech Technology to 1,000+ Languages 的 1,130 種語言的 31K 小時資料進行訓練 [Pratap et al., 2023]。
由 Scaling Speech Technology to 1,000+ Languages 的作者釋出 [Pratap et al., 2023],遵循 [CC-BY-NC 4.0 許可]。
有關用法詳情,請參閱
torchaudio.pipelines.Wav2Vec2FABundle。注意
與其他 Wav2Vec2 包不同,此模型沒有詞語邊界標記(如 |)。這使得對齊的後處理略有不同。