我正在尝试在PyTorch中计算每个通道的渐变图像。为此,我想在图像的每个通道上使用Sobel滤波器执行标准2D卷积。我正在使用torch.nn.functional.conv2d
函数来实现此
在我下面的最小工作示例代码中,我收到错误:
import torch
import torch.nn.functional as F
filters = torch.autograd.Variable(torch.randn(1,1,3,3))
inputs = torch.autograd.Variable(torch.randn(1,3,10,10))
out = F.conv2d(inputs, filters, padding=1)
RuntimeError:给定组= 1,权重[1,1,3,3],所以预期 输入[1,3,10,10]有1个通道,但有3个通道
这表明groups
需要为3.但是,当我groups=3
时,我会收到不同的错误:
import torch
import torch.nn.functional as F
filters = torch.autograd.Variable(torch.randn(1,1,3,3))
inputs = torch.autograd.Variable(torch.randn(1,3,10,10))
out = F.conv2d(inputs, filters, padding=1, groups=3)
RuntimeError:无效参数4:超出范围 /usr/local/src/pytorch/torch/lib/TH/generic/THTensor.c:440
当我检查THTensor类中的代码片段时,它指的是一堆维度检查,但我不知道我哪里出错了。
这个错误是什么意思?如何使用此conv2d
函数执行我想要的卷积?我相信我误解了groups
参数。
答案 0 :(得分:6)
如果您要应用每频道卷积,则out-channel
应与in-channel
相同。这是预期的,考虑到每个输入通道都会创建一个与之对应的单独输出通道。
简而言之,这将有效
import torch
import torch.nn.functional as F
filters = torch.autograd.Variable(torch.randn(3,1,3,3))
inputs = torch.autograd.Variable(torch.randn(1,3,10,10))
out = F.conv2d(inputs, filters, padding=1, groups=3)
然而,尺寸为(2, 1, 3, 3)
或(1, 1, 3, 3)
的过滤器将无效。
此外,您还可以将out-channel
设为in-channel
的倍数。这适用于您希望为每个输入通道设置多个卷积滤镜的情况。
但是,这只有在倍数时才有意义。如果没有,那么pytorch会回落到最接近的倍数,这个数字比你指定的数字少。这再次是预期的行为。例如,尺寸为(4, 1, 3, 3)
或(5, 1, 3, 3)
的过滤器将生成大小为3的out-channel
。