• 文件 >
  • 安裝預構建的二進位制檔案 >
  • 舊版本 (穩定版)
快捷方式

安裝預構建的二進位制檔案

torchaudio 提供了適用於 PyPI (pip) 和 Anaconda (conda) 的二進位制分發包。

詳情請參考 https://pytorch.com.tw/get-started/locally/

注意

每個 torchaudio 包都是針對特定版本的 torch 編譯的。請參考下表並安裝正確匹配的 torchtorchaudio 版本。

注意

0.10 版本開始,torchaudio 提供了僅支援 CPU 和啟用 CUDA 的二進位制分發包,它們分別需要相應的 PyTorch 分發包。

注意

此軟體是針對未修改的 FFmpeg 副本編譯的,並已移除特定的 rpath,以便能夠使用系統庫。LGPL 原始碼可從以下位置下載:n4.1.8 (許可證), n5.0.3 (許可證) 和 n6.0 (許可證)。

依賴項

  • PyTorch

    支援的 PyTorch 版本請參考下面的相容性矩陣。

可選依賴項

  • FFmpeg

    使用 torchaudio.io 模組和 I/O 函式中的 backend="ffmpeg" 時需要。

    從 2.1 版本開始,TorchAudio 官方二進位制分發包相容 FFmpeg 6、5 和 4 版本(>=4.4, <7)。執行時,TorchAudio 首先查詢 FFmpeg 6,如果未找到,則繼續查詢 5,然後是 4。

    有多種方法可以安裝 FFmpeg 庫。請參考官方文件瞭解如何安裝 FFmpeg。如果您使用的是 Anaconda Python 發行版,執行 conda install -c conda-forge 'ffmpeg<7' 將安裝相容的 FFmpeg 庫。

    如果您需要指定 TorchAudio 查詢和連結的 FFmpeg 版本,可以透過環境變數 TORIO_USE_FFMPEG_VERSION 來指定。例如,透過設定 TORIO_USE_FFMPEG_VERSION=5,TorchAudio 將僅查詢 FFmpeg 5。

    如果由於某些原因此查詢機制導致問題,您可以透過設定環境變數 TORIO_USE_FFMPEG=0 來完全停用 FFmpeg 整合。

    有多種方法可以安裝 FFmpeg 庫。如果您使用的是 Anaconda Python 發行版,執行 conda install -c conda-forge 'ffmpeg<7' 將安裝相容的 FFmpeg 庫。

    注意

    在搜尋 FFmpeg 安裝時,TorchAudio 查詢帶有版本號的庫檔案。即 Linux 上的 libavutil.so.<VERSION>,macOS 上的 libavutil.<VERSION>.dylib,以及 Windows 上的 avutil-<VERSION>.dll。許多公開的預構建二進位制檔案都遵循這種命名方案,但有些分發版的檔名沒有版本號。如果您在檢測 FFmpeg 時遇到困難,請仔細檢查您安裝的庫檔案是否遵循此命名方案(並確保它們位於庫搜尋路徑中列出的目錄之一中)。

  • SoX

    在 I/O 函式中使用 backend="sox" 時需要。

    從 2.1 版本開始,TorchAudio 需要單獨安裝 libsox。

    如果動態連結導致問題,您可以設定環境變數 TORCHAUDIO_USE_SOX=0,TorchAudio 將不會使用 SoX。

    注意

    TorchAudio 查詢沒有版本號的庫檔案,即 Linux 上的 libsox.so 和 macOS 上的 libsox.dylib。有些包管理器安裝的庫檔名不同。例如,Ubuntu 上的 aptitude 會安裝 libsox.so.3。要讓 TorchAudio 連結到它,您可以建立一個指向它的符號連結,名稱為 libsox.so(並將符號連結放在庫搜尋路徑中)。

    注意

    TorchAudio 在 libsox 14.4.2 上進行了測試。(其他版本可能無法工作。)

  • SoundFile

    在 I/O 函式中使用 backend="soundfile" 時需要。

  • sentencepiece

    使用 Emformer RNN-T 執行自動語音識別時需要。您可以透過執行 pip install sentencepiece 來安裝它。

  • deep-phonemizer

    使用 Tacotron2 Text-To-Speech 執行文字轉語音時需要。

  • kaldi_io

    使用 torchaudio.kaldi_io 模組時需要。

相容性矩陣

TorchAudio 的官方二進位制分發包包含用 C++ 編寫並連結到特定版本 PyTorch 的擴充套件模組。

來自不同版本的 TorchAudio 和 PyTorch 不能一起使用。請參考下表查詢匹配的版本。

PyTorch

TorchAudio

Python

2.1.0

2.1.0

>=3.8, <=3.11

2.0.1

2.0.2

>=3.8, <=3.11

2.0.0

2.0.1

>=3.8, <=3.11

1.13.1

0.13.1

>=3.7, <=3.10

1.13.0

0.13.0

>=3.7, <=3.10

1.12.1

0.12.1

>=3.7, <=3.10

1.12.0

0.12.0

>=3.7, <=3.10

1.11.0

0.11.0

>=3.7, <=3.9

1.10.0

0.10.0

>=3.6, <=3.9

1.9.1

0.9.1

>=3.6, <=3.9

1.8.1

0.8.1

>=3.6, <=3.9

1.7.1

0.7.2

>=3.6, <=3.9

1.7.0

0.7.0

>=3.6, <=3.8

1.6.0

0.6.0

>=3.6, <=3.8

1.5.0

0.5.0

>=3.5, <=3.8

1.4.0

0.4.0

==2.7, >=3.5, <=3.8

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源