扩张的卷积,萎缩,感受的领域

时间:2018-05-07 15:36:59

标签: computer-vision convolution convolutional-neural-network

我不理解扩张卷积的感受野的价值。事实上,例如,对于常规卷积3x3,感受野是3x3。两个3x3的感受野是5x5。但对于扩张的卷积,它是如何工作的?

实际上,4扩张意味着1个卷积3x3,然后我们应用另一个卷积5x5(只有9个值与0不同),然后卷积7x7(只有9个值与0不同),最后是卷积9x9?如果是这种情况,我不理解4扩张的15x15的值。通过3次扩张,如果我的计算是正确的,我获得了13x13。哪里错了?

What's the use of dilated convolutions?

1 个答案:

答案 0 :(得分:2)

正如您在链接问题的答案中所看到的,步幅(卷积输入值之间的距离)呈指数增长,而非线性增长。如图所示的4扩散卷积使用3层(我将图像链接在这里作为参考):

每次应用3x3卷积,但输入样本之间的距离增长:第一层为1,第二层为2,第三层为4。前两个层一起产生一个感知场,每个红点周围有一个3x3块,导致7x7感受野。在第3层中,对于9个红点中的每一个,再次重复这些7x7块,导致15x15的感受野。

请注意,应该可以进一步增加这些距离,因为存在相当多的重叠(图中较暗的阴影区域):第二层的步长为3,导致9x9,第三层的步长为9,导致27x27。我不知道这是否会导致性能下降,我从未应用过这种技术。