瞭解 PyTorch 生態系統的各個組成部分
Torchaudio 是一個用於 PyTorch 音訊和訊號處理的庫。它提供 I/O、訊號和資料處理功能、資料集、模型實現以及應用程式元件。
一個為大型語言模型 (LLM) 微調而設計的 PyTorch 原生庫。torchtune 支援完整的微調工作流程,並提供與流行生產推理系統的相容性。
該庫是 PyTorch 專案的一部分。PyTorch 是一個開源機器學習框架。torchvision 包包含流行的資料集、模型架構以及計算機視覺中常用的影像變換。
TorchRec 是一個 PyTorch 領域庫,旨在提供大型推薦系統 (RecSys) 所需的常見稀疏性和並行性原語。它允許開發者訓練模型,其中包含分片到多個 GPU 上的大型嵌入表。
一個用於快速媒體解碼和編碼的 PyTorch 庫。當在音訊和影片上執行 PyTorch 模型時,torchcodec 是我們將音訊和影片檔案轉換為模型可用資料的推薦方式。
一個測試版庫,包含常用的模組化資料載入原語,用於輕鬆構建靈活且高效能的資料管道。此外,還有一些功能仍處於原型階段。
torchrl 是一個開源的、Python 優先的 PyTorch 強化學習庫,專注於高模組化和良好的執行時效能,提供低階和高階 RL 抽象以及用於成本函式、回報和資料處理的可重用功能。
tensordict 是一個類似字典的類,它簡化了對張量批次的操作,透過抽象定製操作並透過對葉子進行自動操作排程來減少錯誤,從而增強了程式碼的可讀性、緊湊性和模組化。
PyTorch 透過 torch_xla 包在 XLA 裝置(如 TPU)上執行。本文件描述瞭如何在這些裝置上執行模型。