Tensorflow更快的rcnn提供了良好的检测能力,但仍然可以检测到可可物体的误报

时间:2018-07-25 09:33:06

标签: tensorflow machine-learning object-detection-api

我已经使用tensorflow API通过此处描述的过程-https://pythonprogramming.net/introduction-use-tensorflow-object-detection-api-tutorial/检测吉尼斯竖琴。

大多数情况下,我的效果都很好,只要徽标在图像中清晰可见就可以很好地找到它-enter image description here

good detection

但是,从可可检查站进行再培训之后,它仍然可以检测到我认为是具有很高置信度的可可物体,即人,杂志。我不知道为什么会这样。

(见下文)

false positives

我正在使用在此处找到的fast_rcnn_inception_v2_coco.config-https://github.com/tensorflow/models/blob/master/research/object_detection/samples/configs/faster_rcnn_inception_v2_coco.config

训练更多步骤似乎无济于事,因为总损失平均起来。上面的屏幕截图来自10,000个培训步骤。我正在训练CPU。

我正在使用imgaug扩充训练图像,下面可以看到一个训练图像示例(我在目标周围包括了调试边界框)-

enter image description here

但是,如果训练图像出了问题,图形是否就不会完全检测到目标呢?

1 个答案:

答案 0 :(得分:0)

最近,我遇到了一个类似的问题,从某种程度上来说,这似乎是拟合不足的一个例子,我尝试了多种方法来改善结果。

对我有用的实际上是使用库 imgaug 扩充数据。您可以使用简单的脚本扩展图像边界框,尝试将数据集增加10/12倍。

我还建议添加一些背景图片,即。没有对象的图像,这是一些人在有关张量流的讨论中推荐的。

尝试再次训练数据集,并使用张量板对其进行监视。我认为您将能够大大减少误报的数量。