快捷方式

TACOTRON2_WAVERNN_CHAR_LJSPEECH

torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH

基於字元的 TTS pipeline,使用在 LJSpeech [Ito and Johnson, 2017] 上訓練了 1,500 個週期的 Tacotron2 和在 LJSpeech [Ito and Johnson, 2017] 8 位深度波形上訓練了 10,000 個週期的 WaveRNN 聲碼器。

文字處理器逐個字元地編碼輸入文字。

您可以在此處找到訓練指令碼。使用了以下引數:win_length=1100, hop_length=275, n_fft=2048, mel_fmin=40, 和 mel_fmax=11025

您可以在此處找到訓練指令碼。

有關用法,請參閱torchaudio.pipelines.Tacotron2TTSBundle()

示例 - “Hello world! T T S stands for Text to Speech!”

Spectrogram generated by Tacotron2

示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”

Spectrogram generated by Tacotron2

文件

訪問 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源