跳轉到主要內容
公告社群

改進深度學習工作流程:PyTorch 生態系統工具

作者: 2024 年 5 月 11 日2025 年 4 月 30 日暫無評論

歡迎來到蓬勃發展的 PyTorch 生態系統,這裡有豐富的工具和庫,專門用於提升您作為開發人員或研究人員在深度學習方面的體驗。生態系統工具頁面彙集了來自學術界、工業界、應用程式開發和機器學習領域的專家們的眾多專案。

最初,PyTorch 的目標是建立一個繁榮的社群,讓開發人員能夠訪問彼此的工具,進行有意義的討論,並探索社群內可用的豐富資源。

如今,PyTorch 生態系統已發展壯大,擁有 100 多個根據您的需求量身定製的專案,提供強大的支援、更快的速度以及與 PyTorch 的輕鬆整合。如果您的專案符合我們的使命,我們邀請您提交它,加入這個充滿活力的生態系統。

本月,我們將所有生態系統部落格移至 PyTorch.org 網站,以便為我們的社群提供一個展示最新創新成果的空間。請繼續閱讀,瞭解生態系統中的最新專案!

探索生態系統中的最新工具和框架

隨著我們進入 2024 年,我們很高興展示一系列令人印象深刻的生態系統工具,它們極大地豐富了 PyTorch 社群。這些工具涵蓋了廣泛的領域,包括姿態估計、效能分析,甚至量子計算。讓我們逐一探討,親眼見證它們如何重塑 PyTorch 格局,為開發人員開闢激動人心的可能性。

Anomalib

Anomalib 是一個深度學習庫,旨在收集最先進的異常檢測演算法,用於在公共和私人資料集上進行基準測試。Anomalib 提供了最近文獻中描述的幾種即用型異常檢測演算法的實現,以及一套有助於開發和實現自定義模型的工具。該庫強烈關注基於影像的異常檢測,其演算法目標是識別資料集中的異常影像或影像內的異常畫素區域。Anomalib 不斷更新最新的演算法和訓練/推理擴充套件。

Diffusers

Diffusers 是用於生成影像、音訊甚至分子 3D 結構的最先進預訓練擴散模型的首選庫。無論您是尋求簡單的推理解決方案還是訓練自己的擴散模型,Diffusers 都是一個支援兩者的模組化工具箱。

Pomegranate

Pomegranate 是一個多功能機器學習庫,與 PyTorch 無縫整合。它為機率建模任務提供了廣泛的機率模型和工具。Pomegranate 賦能使用者構建複雜模型,例如隱馬爾可夫模型 (HMM)、貝葉斯網路和高斯混合模型 (GMM)。透過結合 PyTorch 和 Pomegranate 的優勢,開發人員可以利用深度學習和機率建模的力量來解決各種機器學習挑戰。

PyPose

PyPose 是一個基於 PyTorch 的庫,專為姿態估計任務設計。透過 PyPose,開發人員可以高效地訓練和部署用於人體姿態估計的模型,這是一個基本的計算機視覺問題。透過利用 PyTorch 的靈活性和效能,PyPose 簡化了構建準確姿態估計模型的過程。其直觀的 API 和預訓練模型使其成為研究人員和開發人員探索人體姿態估計應用的絕佳選擇。

PyPOTS

一個用於使用 PyTorch 處理部分觀測時間序列的資料探勘的 Python 工具箱/庫,包括支援不完整(不規則取樣)多元時間序列中缺失值的資料補全、分類、聚類和預測任務的 SOTA 模型。

OctoML Profiler

OctoML Profiler 是一種效能分析工具,有助於最佳化 PyTorch 模型。該工具可幫助開發人員識別其深度學習模型中的效能瓶頸和低效率。透過提供對記憶體使用、計算時間v和資料移動的見解,OctoML Profiler 使開發人員能夠微調其模型以提高效率。透過這些有價值的反饋,開發人員可以最佳化其模型,以便在各種硬體平臺上部署。

Open Compass

OpenCompass 是一款大模型評估一站式平臺,旨在為大模型評估提供一個公平、開放、可復現的基準。其主要特點包括:全面支援模型和資料集、高效的分散式評估、多樣化的評估正規化、高可擴充套件性的模組化設計以及實驗管理和報告機制。

Renate

Renate 是一個基於 PyTorch 的神經網路架構搜尋 (NAS) 庫。它簡化了自動搜尋針對特定任務量身定製的最佳神經網路架構的過程。Renate 利用強化學習和進化演算法等技術來有效探索架構空間。透過使用 Renate,開發人員可以節省大量時間和資源,同時發現高效能模型。

RoMa

RoMa 是一個獨立的庫,用於處理 PyTorch 中的旋轉表示(旋轉矩陣、四元數、旋轉向量等)。它旨在實現魯棒性、易用性和效率。

Substra

Substra 是一個開源的聯邦學習 (FL) 軟體。它支援在分散式資料集上訓練和驗證機器學習模型。它提供了一個靈活的 Python 介面和一個 Web 應用程式,可以大規模執行聯邦學習訓練。Substra 的主要用途是在生產環境中。它已被醫院和生物技術公司部署和使用。Substra 也可以在單機上用於執行 FL 模擬和除錯程式碼。

TorchQuantum

TorchQuantum 是一個功能強大的庫,它將 PyTorch 框架與量子計算概念相結合。它使開發人員能夠探索量子機器學習演算法並構建混合經典-量子模型。透過將量子計算原理整合到 PyTorch 中,TorchQuantum 為解決傳統深度學習方法可能難以解決的複雜問題開闢了新的可能性。

TIAToolbox

TIAToolbox(Text-Image-Augmentation Toolbox)是一個 PyTorch 庫,旨在為深度學習任務增強文字和影像資料。它提供了一套全面的資料增強工具,包括轉換、噪聲注入和影像/文字合成。透過應用 TIAToolbox,開發人員可以豐富他們的訓練資料集,提高模型泛化能力,並增強其深度學習模型的魯棒性。

torchdistill

torchdistill 是一個基於 PyTorch 構建的免程式碼框架,用於可重現的深度學習和知識蒸餾研究。該框架旨在讓使用者透過宣告性 PyYAML 配置檔案設計實驗,並支援高階模組抽象。

TorchOpt

TorchOpt 是一個專注於深度學習最佳化演算法的 PyTorch 庫。它提供了最先進的最佳化技術集合,例如隨機梯度下降 (SGD) 變體、自適應學習率方法和最佳化排程。TorchOpt 賦能開發人員高效地微調其模型,更快地收斂,並在各種深度學習任務中實現更好的效能。

USB

USB,或統一語音到文字基準,是一個基於 PyTorch 的工具包,用於訓練和評估語音識別模型。它提供標準化資料集和評估指標,以促進不同語音識別架構之間的公平準確比較。透過使用 USB,研究人員和開發人員可以將其模型與最先進的系統進行基準測試,並推動自動語音識別領域的進步。

Zeus

Zeus 是深度學習能量測量和最佳化領域當前最先進的技術。它具有監控元件,允許使用者測量 GPU 能耗,以及最佳化器元件,可根據監控元件的測量結果自動最佳化 DNN 或 GPU 引數。

成為我們生態系統的一部分

我們多樣化的生態系統工具是 PyTorch 成功的關鍵。它們為姿態估計、機率建模、效能分析、模型可解釋性、語音識別、量子計算、資料增強、最佳化和神經網路架構搜尋等任務提供必要的支援。

利用這些工具可以賦能開發人員和研究人員加速其深度學習工作流程,並在 AI 領域開啟新的可能性。

您的工具是否適合PyTorch 生態系統?如果您能回答以下問題,我們很樂意邀請您提交您的工具進行審查

  1. 您的專案是否補充了 PyTorch,增強了使用者體驗,引入了新功能,或加速了訓練和推理過程?
    • 示例可以包括視覺化工具、核心庫或用於在特定領域(如 NLP)進行研究的框架。
  2. 專案是否已準備好供廣大開發人員使用?
    • 例如,專案是否穩定,是否會得到維護,以及是否有足夠的支援基礎設施、文件和技術支援以允許開發人員成功使用它?

感謝我們生態系統中的所有貢獻者和合作者!祝 2024 年一切順利。