应用错误收集

如何在更快的RCNN的区域建议网络中将锚点与地面实况框结合起来？

时间：2017-07-24 10:03:21

标签： tensorflow computer-vision deep-learning object-detection

这是更快的RCNN的RPN。

我们可以在最终的转换特征图上看到一个3 * 3的滑动窗口。对于滑动窗口中的每个中心位置，我们建议 k个锚箱。为了训练这个网络，我们应该将这些锚框映射到真实图像。

如何将滑动窗口的位置映射到真实图像的位置？
如何将建议的区域再次映射到要素图，因为尺寸不会相互匹配。

1 个答案:

答案 0 :(得分：0)

卷积运算是变换不变运算。让我们说原始图像在最终卷积层时被 n次下采样，然后将上面滑动窗口的中心位置映射到真实图像是任务。 / p>

我认为我们可以使用转换不变质量和对要素图进行n次上采样以便找到位置。