在论文“用于语义分割的完全卷积网络”#39; 作者在反卷积的背景下区分输入步幅和输出步幅。 这些术语如何相互不同?
答案 0 :(得分:5)
输入步幅是过滤器的步幅。您在输出中移动了多少过滤器。
输出步幅这实际上是一个名义价值。在进行多次卷积,最大池操作后,我们在CNN中获得了特征映射。假设我们的输入图像是 224 * 224 ,我们的最终特征图是 7 * 7 。
然后我们说我们的输出步幅是:224/7 = 32(近似下采样后图像发生的情况。)
此张量流script描述了此输出步幅是什么,以及如何在FCN中使用,这是密集预测的情况。
一个使用输入 空间维度是32加1的倍数,例如[321,321]。在 在这种情况下,ResNet输出的特征图将具有空间形状 [(height - 1)/ output_stride + 1,(width - 1)/ output_stride + 1] 和角完全对齐输入图像角,这很大 有助于将特征与图像对齐。用作输入[225,225] 图像在最后一个ResNet块的输出处生成[8,8]个特征映射。