应用错误收集

输入步幅是过滤器的步幅。您在输出中移动了多少过滤器。

输出步幅这实际上是一个名义价值。在进行多次卷积，最大池操作后，我们在CNN中获得了特征映射。假设我们的输入图像是 224 * 224 ，我们的最终特征图是 7 * 7 。

然后我们说我们的输出步幅是：224/7 = 32（近似下采样后图像发生的情况。）

此张量流script描述了此输出步幅是什么，以及如何在FCN中使用，这是密集预测的情况。

一个使用输入空间维度是32加1的倍数，例如[321,321]。在在这种情况下，ResNet输出的特征图将具有空间形状 [（height - 1）/ output_stride + 1，（width - 1）/ output_stride + 1] 和角完全对齐输入图像角，这很大有助于将特征与图像对齐。用作输入[225,225] 图像在最后一个ResNet块的输出处生成[8,8]个特征映射。

CNN：输入步幅与输出步幅

1 个答案: