安裝預構建的二進位制檔案¶

torchaudio 提供了適用於 PyPI (pip) 和 Anaconda (conda) 的二進位制分發包。

詳情請參考 https://pytorch.com.tw/get-started/locally/。

注意

每個 torchaudio 包都是針對特定版本的 torch 編譯的。請參考下表並安裝正確匹配的 torch 和 torchaudio 版本。

注意

從 0.10 版本開始，torchaudio 提供了僅支援 CPU 和啟用 CUDA 的二進位制分發包，它們分別需要相應的 PyTorch 分發包。

注意

此軟體是針對未修改的 FFmpeg 副本編譯的，並已移除特定的 rpath，以便能夠使用系統庫。LGPL 原始碼可從以下位置下載：n4.1.8 (許可證), n5.0.3 (許可證) 和 n6.0 (許可證)。

依賴項¶

PyTorch

支援的 PyTorch 版本請參考下面的相容性矩陣。

可選依賴項¶

FFmpeg

使用 torchaudio.io 模組和 I/O 函式中的 backend="ffmpeg" 時需要。

從 2.1 版本開始，TorchAudio 官方二進位制分發包相容 FFmpeg 6、5 和 4 版本（>=4.4, <7）。執行時，TorchAudio 首先查詢 FFmpeg 6，如果未找到，則繼續查詢 5，然後是 4。

有多種方法可以安裝 FFmpeg 庫。請參考官方文件瞭解如何安裝 FFmpeg。如果您使用的是 Anaconda Python 發行版，執行 conda install -c conda-forge 'ffmpeg<7' 將安裝相容的 FFmpeg 庫。

如果您需要指定 TorchAudio 查詢和連結的 FFmpeg 版本，可以透過環境變數 TORIO_USE_FFMPEG_VERSION 來指定。例如，透過設定 TORIO_USE_FFMPEG_VERSION=5，TorchAudio 將僅查詢 FFmpeg 5。

如果由於某些原因此查詢機制導致問題，您可以透過設定環境變數 TORIO_USE_FFMPEG=0 來完全停用 FFmpeg 整合。

有多種方法可以安裝 FFmpeg 庫。如果您使用的是 Anaconda Python 發行版，執行 conda install -c conda-forge 'ffmpeg<7' 將安裝相容的 FFmpeg 庫。

注意

在搜尋 FFmpeg 安裝時，TorchAudio 查詢帶有版本號的庫檔案。即 Linux 上的 libavutil.so.<VERSION>，macOS 上的 libavutil.<VERSION>.dylib，以及 Windows 上的 avutil-<VERSION>.dll。許多公開的預構建二進位制檔案都遵循這種命名方案，但有些分發版的檔名沒有版本號。如果您在檢測 FFmpeg 時遇到困難，請仔細檢查您安裝的庫檔案是否遵循此命名方案（並確保它們位於庫搜尋路徑中列出的目錄之一中）。
SoX

在 I/O 函式中使用 backend="sox" 時需要。

從 2.1 版本開始，TorchAudio 需要單獨安裝 libsox。

如果動態連結導致問題，您可以設定環境變數 TORCHAUDIO_USE_SOX=0，TorchAudio 將不會使用 SoX。

注意

TorchAudio 查詢沒有版本號的庫檔案，即 Linux 上的 libsox.so 和 macOS 上的 libsox.dylib。有些包管理器安裝的庫檔名不同。例如，Ubuntu 上的 aptitude 會安裝 libsox.so.3。要讓 TorchAudio 連結到它，您可以建立一個指向它的符號連結，名稱為 libsox.so（並將符號連結放在庫搜尋路徑中）。

注意

TorchAudio 在 libsox 14.4.2 上進行了測試。（其他版本可能無法工作。）
SoundFile

在 I/O 函式中使用 backend="soundfile" 時需要。
sentencepiece

使用 Emformer RNN-T 執行自動語音識別時需要。您可以透過執行 pip install sentencepiece 來安裝它。
deep-phonemizer

使用 Tacotron2 Text-To-Speech 執行文字轉語音時需要。
kaldi_io

使用 torchaudio.kaldi_io 模組時需要。

相容性矩陣¶

TorchAudio 的官方二進位制分發包包含用 C++ 編寫並連結到特定版本 PyTorch 的擴充套件模組。

來自不同版本的 TorchAudio 和 PyTorch 不能一起使用。請參考下表查詢匹配的版本。

`PyTorch`	`TorchAudio`	`Python`
`2.1.0`	`2.1.0`	`>=3.8`, `<=3.11`
`2.0.1`	`2.0.2`	`>=3.8`, `<=3.11`
`2.0.0`	`2.0.1`	`>=3.8`, `<=3.11`
`1.13.1`	`0.13.1`	`>=3.7`, `<=3.10`
`1.13.0`	`0.13.0`	`>=3.7`, `<=3.10`
`1.12.1`	`0.12.1`	`>=3.7`, `<=3.10`
`1.12.0`	`0.12.0`	`>=3.7`, `<=3.10`
`1.11.0`	`0.11.0`	`>=3.7`, `<=3.9`
`1.10.0`	`0.10.0`	`>=3.6`, `<=3.9`
`1.9.1`	`0.9.1`	`>=3.6`, `<=3.9`
`1.8.1`	`0.8.1`	`>=3.6`, `<=3.9`
`1.7.1`	`0.7.2`	`>=3.6`, `<=3.9`
`1.7.0`	`0.7.0`	`>=3.6`, `<=3.8`
`1.6.0`	`0.6.0`	`>=3.6`, `<=3.8`
`1.5.0`	`0.5.0`	`>=3.5`, `<=3.8`
`1.4.0`	`0.4.0`	`==2.7`, `>=3.5`, `<=3.8`

安裝預構建的二進位制檔案¶

依賴項¶

可選依賴項¶

相容性矩陣¶

文件

教程

資源