在一篇论文中,我看到了下表关于层与各自的感受域之间的关系。我有两个问题:
1)如何计算这种关系,是否有可以遵循的公式。
2)例如,在最后几个层中,例如pool5
,fc6&fc7
,具有相当大的感知字段。 fc6& fc7的感受野是404 * 404。如果训练图像为256*256
,是否意味着fc6&fc7
在256*256
的边界之外看到了很多像素(或者只是浪费了fc6&fc7
的强大功能* 404作为接受领域)。在执行classifciaiton / feature extraction类型的工作时,我不确定如何理解特定图层中感受野的物理意义。
答案 0 :(得分:0)
让我们说你有两层最大拉力。 第一层将是一个带有过滤器3X3和1X1的步幅,比2X2的最大池池具有2X2步幅,比第二个带有3X3过滤器和1X1步幅的第二个污染层。
第一层从oriignal图像中查看3X3的neiogbhords,因此感受野将是3X3。比最大合并层效果更低,将图像下采样两倍,因此第二层的输入是原始图像,采样数为2.现在,当前图层也在寻找3X3的neigbhords但是在DOWNSAMPLED图像上意味着这个过滤器会查看来自原始图像的(downsapleFactor filterSize)X(downsapleFactor filterSize)niegbrhood的像素!因此,感染领域将是6X6。