我一直在玩Fast-RCNN一段时间,但仍然无法获得一些核心机制。
在教程幻灯片(http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-detection.pdf的第28页)中,他们有一个示例输出,每个对象只有一个边界框:
http://s22.postimg.org/7rbu05xbl/Screen_Shot_2015_12_04_at_2_19_57_PM.png
具体而言,对所有区域提案(https://github.com/rbgirshick/fast-rcnn/blob/master/lib/fast_rcnn/test.py#L324)执行非最大限制抑制,但在我的情况下,它仍然包含图像中每个对象的数十个区域。
我的边界框看起来如下,阈值为0.99:
http://s29.postimg.org/oc33ujgrb/foo.jpg
重叠区域的边界框如何以及在哪里最终确定为一个?
答案 0 :(得分:0)
非最大限制应该明确过滤出示例图像中的重叠边界框。 再次检查您是否正确使用它,并在使用网络输出微调初始边界框后执行此操作。
答案 1 :(得分:0)
非最大抑制拒绝大于阈值的重叠区域。由于您的阈值为0.99,因此很少有重叠区域被拒绝。