Video ResNet¶
VideoResNet 模型基於論文 A Closer Look at Spatiotemporal Convolutions for Action Recognition。
警告
影片模組處於 Beta 階段,不保證向後相容性。
模型構建器¶
可以使用以下模型構建器例項化 VideoResNet 模型,可選擇使用或不使用預訓練權重。所有模型構建器內部都依賴於 torchvision.models.video.resnet.VideoResNet 基類。有關此類的更多詳細資訊,請參閱 原始碼。
|
構建 18 層 Resnet3D 模型。 |
|
構建 18 層混合卷積網路,如(論文中)。 |
|
構建 18 層深度 R(2+1)D 網路,如(論文中)。 |