应用错误收集

时间：2015-12-04 01:43:14

标签： computer-vision neural-network deep-learning caffe

我一直在玩Fast-RCNN一段时间，但仍然无法获得一些核心机制。

在教程幻灯片（http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-detection.pdf的第28页）中，他们有一个示例输出，每个对象只有一个边界框：

具体而言，对所有区域提案（https://github.com/rbgirshick/fast-rcnn/blob/master/lib/fast_rcnn/test.py#L324）执行非最大限制抑制，但在我的情况下，它仍然包含图像中每个对象的数十个区域。

我的边界框看起来如下，阈值为0.99：

重叠区域的边界框如何以及在哪里最终确定为一个？

答案 0 :(得分：0)

非最大限制应该明确过滤出示例图像中的重叠边界框。再次检查您是否正确使用它，并在使用网络输出微调初始边界框后执行此操作。

答案 1 :(得分：0)

非最大抑制拒绝大于阈值的重叠区域。由于您的阈值为0.99，因此很少有重叠区域被拒绝。