從原始碼構建¶
TorchAudio 集成了 PyTorch 用於數值計算以及第三方庫用於多媒體 I/O。從原始碼構建需要以下工具。
大多數工具都可以在 Conda 中獲取,因此我們建議使用 conda。
定製構建¶
TorchAudio 與第三方庫的整合可以透過環境變數啟用/停用。
透過傳遞 1 啟用,透過 0 停用。
BUILD_SOX: 啟用/停用基於 libsox 的 I/O 功能。BUILD_KALDI: 啟用/停用基於 Kaldi 的特徵提取。BUILD_RNNT: 啟用/停用自定義 RNN-T 損失函式。USE_FFMPEG: 啟用/停用基於 FFmpeg 庫的 I/O 功能。USE_ROCM: 啟用/停用 AMD ROCm 支援。USE_CUDA: 啟用/停用 CUDA 支援。
有關最新配置及其預設值,請檢視原始碼。 https://github.com/pytorch/audio/blob/main/tools/setup_helpers/extension.py