安裝預構建的二進位制檔案¶
torchaudio 提供了適用於 PyPI (pip) 和 Anaconda (conda) 的二進位制分發包。
詳情請參考 https://pytorch.com.tw/get-started/locally/。
注意
每個 torchaudio 包都是針對特定版本的 torch 編譯的。請參考下表並安裝正確匹配的 torch 和 torchaudio 版本。
注意
從 0.10 版本開始,torchaudio 提供了僅支援 CPU 和啟用 CUDA 的二進位制分發包,它們分別需要相應的 PyTorch 分發包。
注意
此軟體是針對未修改的 FFmpeg 副本編譯的,並已移除特定的 rpath,以便能夠使用系統庫。LGPL 原始碼可從以下位置下載:n4.1.8 (許可證), n5.0.3 (許可證) 和 n6.0 (許可證)。
依賴項¶
-
支援的 PyTorch 版本請參考下面的相容性矩陣。
可選依賴項¶
-
使用
torchaudio.io模組和 I/O 函式中的backend="ffmpeg"時需要。從 2.1 版本開始,TorchAudio 官方二進位制分發包相容 FFmpeg 6、5 和 4 版本(>=4.4, <7)。執行時,TorchAudio 首先查詢 FFmpeg 6,如果未找到,則繼續查詢 5,然後是 4。
有多種方法可以安裝 FFmpeg 庫。請參考官方文件瞭解如何安裝 FFmpeg。如果您使用的是 Anaconda Python 發行版,執行
conda install -c conda-forge 'ffmpeg<7'將安裝相容的 FFmpeg 庫。如果您需要指定 TorchAudio 查詢和連結的 FFmpeg 版本,可以透過環境變數
TORIO_USE_FFMPEG_VERSION來指定。例如,透過設定TORIO_USE_FFMPEG_VERSION=5,TorchAudio 將僅查詢 FFmpeg 5。如果由於某些原因此查詢機制導致問題,您可以透過設定環境變數
TORIO_USE_FFMPEG=0來完全停用 FFmpeg 整合。有多種方法可以安裝 FFmpeg 庫。如果您使用的是 Anaconda Python 發行版,執行
conda install -c conda-forge 'ffmpeg<7'將安裝相容的 FFmpeg 庫。注意
在搜尋 FFmpeg 安裝時,TorchAudio 查詢帶有版本號的庫檔案。即 Linux 上的
libavutil.so.<VERSION>,macOS 上的libavutil.<VERSION>.dylib,以及 Windows 上的avutil-<VERSION>.dll。許多公開的預構建二進位制檔案都遵循這種命名方案,但有些分發版的檔名沒有版本號。如果您在檢測 FFmpeg 時遇到困難,請仔細檢查您安裝的庫檔案是否遵循此命名方案(並確保它們位於庫搜尋路徑中列出的目錄之一中)。 -
在 I/O 函式中使用
backend="sox"時需要。從 2.1 版本開始,TorchAudio 需要單獨安裝 libsox。
如果動態連結導致問題,您可以設定環境變數
TORCHAUDIO_USE_SOX=0,TorchAudio 將不會使用 SoX。注意
TorchAudio 查詢沒有版本號的庫檔案,即 Linux 上的
libsox.so和 macOS 上的libsox.dylib。有些包管理器安裝的庫檔名不同。例如,Ubuntu 上的 aptitude 會安裝libsox.so.3。要讓 TorchAudio 連結到它,您可以建立一個指向它的符號連結,名稱為libsox.so(並將符號連結放在庫搜尋路徑中)。注意
TorchAudio 在 libsox 14.4.2 上進行了測試。(其他版本可能無法工作。)
-
在 I/O 函式中使用
backend="soundfile"時需要。 -
使用 Emformer RNN-T 執行自動語音識別時需要。您可以透過執行
pip install sentencepiece來安裝它。 -
使用 Tacotron2 Text-To-Speech 執行文字轉語音時需要。
-
使用
torchaudio.kaldi_io模組時需要。
相容性矩陣¶
TorchAudio 的官方二進位制分發包包含用 C++ 編寫並連結到特定版本 PyTorch 的擴充套件模組。
來自不同版本的 TorchAudio 和 PyTorch 不能一起使用。請參考下表查詢匹配的版本。
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|