Wav2Vec2FABundle.Aligner¶
- class torchaudio.pipelines.Wav2Vec2FABundle.Aligner¶
對齊器的介面
方法¶
__call__¶
- abstract Aligner.__call__(emission: Tensor, tokens: List[List[int]]) List[List[TokenSpan]]¶
生成帶時間戳的 token 序列列表
- 引數:
emission (Tensor) – 對數域中的 token 機率分佈序列。形狀:(時間, token)。
tokens (python:integer sequence 的列表) – Tokenization 後的文字。來自
torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer的輸出。
- 返回:
帶時間戳和分數的 token。
- 返回型別:
(TokenSpan 序列的列表)