快捷方式

影片 MViT

MViT 模型基於 MViTv2: Improved Multiscale Vision Transformers for Classification and DetectionMultiscale Vision Transformers 論文。

模型構建器

以下模型構建器可用於例項化 MViT v1 或 v2 模型,無論是否帶有預訓練權重。所有模型構建器內部都依賴於 torchvision.models.video.MViT 基類。有關此類的更多詳細資訊,請參閱原始碼

mvit_v1_b(*[, weights, progress])

根據 Multiscale Vision Transformers 構建基礎 MViTV1 架構。

mvit_v2_s(*[, weights, progress])

根據 Multiscale Vision TransformersMViTv2: Improved Multiscale Vision Transformers for Classification and Detection 構建小型 MViTV2 架構。

文件

查閱 PyTorch 的綜合開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源