跳轉到主要內容

面向研究人員的 PyTorch Hub

探索和擴充套件來自最新尖端研究的模型。

發現併發布模型到為研究探索而設計的預訓練模型庫。檢視適用於研究人員的模型,或瞭解其工作原理貢獻模型

*這是一個測試版本 – 我們將在未來幾個月收集反饋並改進 PyTorch Hub。

  • 重置

PyTorch-Transformers

流行 NLP Transformers 的 PyTorch 實現

15.12萬

YOLOv5

Ultralytics YOLOv5 🚀 用於目標檢測、例項分割和影像分類。

5.57萬

RoBERTa

一種穩健最佳化的 BERT 預訓練方法

3.19萬

Transformer (NMT)

用於英法和英德翻譯的 Transformer 模型。

3.19萬

ResNet

在 ImageNet 上預訓練的深度殘差網路

1.72萬

ResNeXt

下一代 ResNet,更高效、更精確

1.72萬

ShuffleNet v2

一個為速度和記憶體最佳化的高效卷積網路,在 ImageNet 上預訓練

1.72萬

Deeplabv3

帶 ResNet-50、ResNet-101 和 MobileNet-V3 主幹的 DeepLabV3 模型

1.72萬

AlexNet

2012 年 ImageNet 冠軍,其 top-5 錯誤率為 15.3%,比亞軍低 10.8 個百分點以上。

1.72萬

SqueezeNet

AlexNet 級別的精度,引數量減少 50 倍。

1.72萬

DenseNet

密集卷積網路 (DenseNet),以前饋方式將每一層連線到其他所有層。

1.72萬

VGG-Nets

2014 年 ImageNet ILSVRC 挑戰賽的獲獎卷積網路

1.72萬

FCN

帶有 ResNet-50 和 ResNet-101 主幹的全卷積網路模型

1.72萬

Wide ResNet

寬殘差網路

1.72萬

GoogLeNet

GoogLeNet 基於一個代號為“Inception”的深度卷積神經網路架構,該網路贏得了 2014 年 ImageNet 比賽。

1.72萬

Inception_v3

又稱 GoogleNetv3,一個著名的、在 ImageNet 上訓練的 2015 年卷積網路

1.72萬

MobileNet v2

為速度和記憶體最佳化的高效網路,帶有殘差塊

1.72萬

SSD

用於目標檢測的單發多框檢測器模型

1.45萬

Tacotron 2

用於從文字生成梅爾頻譜圖的 Tacotron 2 模型

1.45萬

WaveGlow

用於從梅爾頻譜圖(由 Tacotron2 生成)生成語音的 WaveGlow 模型

1.45萬

FastPitch 2

用於從文字生成梅爾頻譜圖的 FastPitch 模型

1.45萬

GPUNet

GPUNet 是一系列新的卷積神經網路,旨在最大化 NVIDIA GPU 和 TensorRT 的效能。

1.45萬

EfficientNet

EfficientNets 是一系列影像分類模型,它們實現了最先進的精度,同時尺寸和速度提高了一個數量級。使用 Tensor Cores 進行混合精度訓練。

1.45萬

HiFi GAN

用於從梅爾頻譜圖生成波形的 HiFi GAN 模型

1.45萬

ResNet50

使用 Tensor Cores 進行混合精度訓練的 ResNet50 模型。

1.45萬

ResNeXt101

將 ResNet 中瓶頸 3x3 卷積替換為 3x3 分組卷積的 ResNet,使用 Tensor Cores 進行混合精度訓練。

1.45萬

SE-ResNeXt101

添加了 Squeeze-and-Excitation 模組的 ResNeXt,使用 Tensor Cores 進行混合精度訓練。

1.45萬

Silero 語音活動檢測器

預訓練語音活動檢測器

7100

Silero 語音轉文字模型

一套緊湊的企業級多語言預訓練語音轉文字模型。

5500

Silero 文字轉語音模型

一套緊湊的企業級多語言預訓練文字轉語音模型

5500

MiDaS

MiDaS 模型用於從單個影像計算相對深度。

5200

SNNMLP

受大腦啟發的、帶有脈衝神經元的多層感知器

4.3k

GhostNet

透過廉價操作生成更多特徵的高效網路

4.3k

3D ResNet

在 Kinetics 400 資料集上預訓練的 ResNet 風格影片分類網路

3500

SlowFast

在 Kinetics 400 資料集上預訓練的 SlowFast 網路

3500

X3D

在 Kinetics 400 資料集上預訓練的 X3D 網路

3500

ResNeSt

ResNet 的一個新變體。

3300

YOLOP

在 BDD100K 資料集上預訓練的 YOLOP

2100

一次性(Once-for-All)

一次性(OFA)將訓練和搜尋解耦,並在各種邊緣裝置和資源限制下實現高效推理。

1.9k

FashionGen 上的 DCGAN

一個簡單的用於 64x64 影像的生成式影像模型

1.6k

漸進式增長 GAN (PGAN)

時尚、名人面孔的高質量影像生成

1.6k

ProxylessNAS

為不同的硬體平臺無代理地專門化 CNN 架構。

1500

Open-Unmix

音樂源分離的參考實現

1.4k

IBN-Net

具有域/外觀不變性的網路

808

用於腦部MRI的U-Net

帶批次歸一化的U-Net,用於生物醫學影像分割,預訓練權重用於腦部MRI中的異常分割

763

MEAL_V2

使用知識蒸餾提升小型高效模型。

696

HybridNets

HybridNets – 端到端感知網路

653

ResNext WSL

使用億級弱監督資料訓練的 ResNext 模型。

601

HarDNet

在 ImageNet 上預訓練的 Harmonic DenseNet

369

半監督和半弱監督 ImageNet 模型

在“Billion scale semi-supervised learning for image classification”論文中介紹的 ResNet 和 ResNext 模型

245

SimpleNet

讓我們保持簡單,使用簡單的架構超越更深、更復雜的架構

53

ntsnet

使用此細粒度影像分類器對鳥類進行分類

34