ConvTranspose2d¶
- class torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)[原始碼][原始碼]¶
在由多個輸入平面組成的輸入影像上應用一個二維轉置卷積運算元。
該模組可以看作是 Conv2d 相對於其輸入的梯度。它也被稱為分數步長卷積或反捲積(儘管它並非真實的逆卷積操作,因為它並非計算卷積的真實逆運算)。有關更多資訊,請參閱此處的視覺化以及《Deconvolutional Networks》論文。
該模組支援 TensorFloat32。
在某些 ROCm 裝置上,使用 float16 輸入時,該模組在反向傳播時會使用不同的精度。
stride控制互相關操作的步長。padding控制dilation * (kernel_size - 1) - padding個點的兩端隱式零填充量。詳細資訊請參見下面的注意事項。output_padding控制新增到輸出形狀一側的額外大小。詳細資訊請參見下面的注意事項。dilation控制卷積核點之間的間距;也稱為 à trous 演算法。這比較難以描述,但此處的連結對dilation的作用有一個很好的視覺化。groups控制輸入和輸出之間的連線。in_channels和out_channels都必須能被groups整除。例如:當 groups=1 時,所有輸入都與所有輸出進行卷積。
當 groups=2 時,該操作等同於有兩個並排的卷積層,每個層處理一半的輸入通道並生成一半的輸出通道,然後將兩者拼接起來。
當 groups=
in_channels時,每個輸入通道都與其自身的一組濾波器(大小為 )進行卷積。
引數
kernel_size、stride、padding、output_padding可以是單個
int– 在這種情況下,高度和寬度維度使用相同的值包含兩個 int 的
tuple– 在這種情況下,第一個 int 用於高度維度,第二個 int 用於寬度維度
注意
padding引數有效地向輸入的兩側添加了dilation * (kernel_size - 1) - padding量的零填充。這樣設定是為了使當Conv2d和ConvTranspose2d用相同的引數初始化時,它們在輸入和輸出形狀方面互為逆運算。然而,當stride > 1時,Conv2d將多個輸入形狀對映到相同的輸出形狀。output_padding透過有效地增加一側的計算輸出形狀來解決這種歧義。請注意,output_padding僅用於確定輸出形狀,實際上不會向輸出新增零填充。注意
在某些情況下,當在 CUDA 裝置上給定張量並使用 CuDNN 時,該運算元可能會選擇非確定性演算法以提高效能。如果不希望這樣,您可以透過設定
torch.backends.cudnn.deterministic = True來嘗試使操作具有確定性(可能以效能為代價)。有關更多資訊,請參閱可復現性。- 引數
in_channels (int) – 輸入影像中的通道數
out_channels (int) – 卷積產生的通道數
padding (int 或 tuple, 可選) – 將
dilation * (kernel_size - 1) - padding量的零填充新增到輸入的每個維度的兩側。預設值: 0output_padding (int 或 tuple, 可選) – 新增到輸出形狀的每個維度一側的額外大小。預設值: 0
groups (int, 可選) – 從輸入通道到輸出通道的阻塞連線數。預設值: 1
bias (bool, 可選) – 如果為
True,則在輸出中新增可學習的偏置。預設值:True
- 形狀
輸入: 或
輸出: 或 ,其中
- 變數
示例
>>> # With square kernels and equal stride >>> m = nn.ConvTranspose2d(16, 33, 3, stride=2) >>> # non-square kernels and unequal stride and with padding >>> m = nn.ConvTranspose2d(16, 33, (3, 5), stride=(2, 1), padding=(4, 2)) >>> input = torch.randn(20, 16, 50, 100) >>> output = m(input) >>> # exact output size can be also specified as an argument >>> input = torch.randn(1, 16, 12, 12) >>> downsample = nn.Conv2d(16, 16, 3, stride=2, padding=1) >>> upsample = nn.ConvTranspose2d(16, 16, 3, stride=2, padding=1) >>> h = downsample(input) >>> h.size() torch.Size([1, 16, 6, 6]) >>> output = upsample(h, output_size=input.size()) >>> output.size() torch.Size([1, 16, 12, 12])