CNN:输入步幅与输出步幅

时间:2017-06-16 10:23:12

标签: conv-neural-network convolution deconvolution

在论文“用于语义分割的完全卷积网络”#39; 作者在反卷积的背景下区分输入步幅和输出步幅。 这些术语如何相互不同?

1 个答案:

答案 0 :(得分:5)

输入步幅是过滤器的步幅。您在输出中移动了多少过滤器。

输出步幅这实际上是一个名义价值。在进行多次卷积,最大池操作后,我们在CNN中获得了特征映射。假设我们的输入图像是 224 * 224 ,我们的最终特征图是 7 * 7

然后我们说我们的输出步幅是:224/7 = 32(近似下采样后图像发生的情况。)

此张量流script描述了此输出步幅是什么,以及如何在FCN中使用,这是密集预测的情况。

  

一个使用输入     空间维度是32加1的倍数,例如[321,321]。在     在这种情况下,ResNet输出的特征图将具有空间形状     [(height - 1)/ output_stride + 1,(width - 1)/ output_stride + 1]     和角完全对齐输入图像角,这很大     有助于将特征与图像对齐。用作输入[225,225]     图像在最后一个ResNet块的输出处生成[8,8]个特征映射。