Fast-RCNN最终边界框

时间:2015-12-04 01:43:14

标签: computer-vision neural-network deep-learning caffe

我一直在玩Fast-RCNN一段时间,但仍然无法获得一些核心机制。

在教程幻灯片(http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-detection.pdf的第28页)中,他们有一个示例输出,每个对象只有一个边界框:

http://s22.postimg.org/7rbu05xbl/Screen_Shot_2015_12_04_at_2_19_57_PM.png

具体而言,对所有区域提案(https://github.com/rbgirshick/fast-rcnn/blob/master/lib/fast_rcnn/test.py#L324)执行非最大限制抑制,但在我的情况下,它仍然包含图像中每个对象的数十个区域。

我的边界框看起来如下,阈值为0.99:

http://s29.postimg.org/oc33ujgrb/foo.jpg

重叠区域的边界框如何以及在哪里最终确定为一个?

2 个答案:

答案 0 :(得分:0)

非最大限制应该明确过滤出示例图像中的重叠边界框。 再次检查您是否正确使用它,并在使用网络输出微调初始边界框后执行此操作。

答案 1 :(得分:0)

非最大抑制拒绝大于阈值的重叠区域。由于您的阈值为0.99,因此很少有重叠区域被拒绝。