应用错误收集

时间：2018-05-07 15:36:59

标签： computer-vision convolution convolutional-neural-network

我不理解扩张卷积的感受野的价值。事实上，例如，对于常规卷积3x3，感受野是3x3。两个3x3的感受野是5x5。但对于扩张的卷积，它是如何工作的？

实际上，4扩张意味着1个卷积3x3，然后我们应用另一个卷积5x5（只有9个值与0不同），然后卷积7x7（只有9个值与0不同），最后是卷积9x9？如果是这种情况，我不理解4扩张的15x15的值。通过3次扩张，如果我的计算是正确的，我获得了13x13。哪里错了？

答案 0 :(得分：2)

正如您在链接问题的答案中所看到的，步幅（卷积输入值之间的距离）呈指数增长，而非线性增长。如图所示的4扩散卷积使用3层（我将图像链接在这里作为参考）：

每次应用3x3卷积，但输入样本之间的距离增长：第一层为1，第二层为2，第三层为4。前两个层一起产生一个感知场，每个红点周围有一个3x3块，导致7x7感受野。在第3层中，对于9个红点中的每一个，再次重复这些7x7块，导致15x15的感受野。

请注意，应该可以进一步增加这些距离，因为存在相当多的重叠（图中较暗的阴影区域）：第二层的步长为3，导致9x9，第三层的步长为9，导致27x27。我不知道这是否会导致性能下降，我从未应用过这种技术。