TACOTRON2_WAVERNN_CHAR_LJSPEECH¶
- torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH¶
基於字元的 TTS pipeline,使用在 LJSpeech [Ito and Johnson, 2017] 上訓練了 1,500 個週期的
Tacotron2和在 LJSpeech [Ito and Johnson, 2017] 8 位深度波形上訓練了 10,000 個週期的WaveRNN聲碼器。文字處理器逐個字元地編碼輸入文字。
您可以在此處找到訓練指令碼。使用了以下引數:
win_length=1100,hop_length=275,n_fft=2048,mel_fmin=40, 和mel_fmax=11025。您可以在此處找到訓練指令碼。
有關用法,請參閱
torchaudio.pipelines.Tacotron2TTSBundle()。示例 - “Hello world! T T S stands for Text to Speech!”
示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”