如何在更快的RCNN的区域建议网络中将锚点与地面实况框结合起来?

时间:2017-07-24 10:03:21

标签: tensorflow computer-vision deep-learning object-detection

Region Proposal Network of Faster RCNN

这是更快的RCNN的RPN。

我们可以在最终的转换特征图上看到一个3 * 3的滑动窗口。对于滑动窗口中的每个中心位置,我们建议 k个锚箱。为了训练这个网络,我们应该将这些锚框映射到真实图像

  1. 如何将滑动窗口的位置映射到真实图像的位置?

  2. 如何将建议的区域再次映射到要素图,因为尺寸不会相互匹配。

1 个答案:

答案 0 :(得分:0)

卷积运算是变换不变运算。让我们说原始图像在最终卷积层时被 n次下采样,然后将上面滑动窗口的中心位置映射到真实图像是任务。 / p>

我认为我们可以使用转换不变质量和对要素图进行n次上采样以便找到位置。