应用错误收集

Tensorflow更快的rcnn提供了良好的检测能力，但仍然可以检测到可可物体的误报

时间：2018-07-25 09:33:06

标签： tensorflow machine-learning object-detection-api

我已经使用tensorflow API通过此处描述的过程-https://pythonprogramming.net/introduction-use-tensorflow-object-detection-api-tutorial/检测吉尼斯竖琴。

大多数情况下，我的效果都很好，只要徽标在图像中清晰可见就可以很好地找到它-

但是，从可可检查站进行再培训之后，它仍然可以检测到我认为是具有很高置信度的可可物体，即人，杂志。我不知道为什么会这样。

（见下文）

我正在使用在此处找到的fast_rcnn_inception_v2_coco.config-https://github.com/tensorflow/models/blob/master/research/object_detection/samples/configs/faster_rcnn_inception_v2_coco.config

训练更多步骤似乎无济于事，因为总损失平均起来。上面的屏幕截图来自10,000个培训步骤。我正在训练CPU。

我正在使用imgaug扩充训练图像，下面可以看到一个训练图像示例（我在目标周围包括了调试边界框）-

但是，如果训练图像出了问题，图形是否就不会完全检测到目标呢？

1 个答案:

答案 0 :(得分：0)

最近，我遇到了一个类似的问题，从某种程度上来说，这似乎是拟合不足的一个例子，我尝试了多种方法来改善结果。

对我有用的实际上是使用库 imgaug 扩充数据。您可以使用简单的脚本扩展图像和边界框，尝试将数据集增加10/12倍。

我还建议添加一些背景图片，即。没有对象的图像，这是一些人在有关张量流的讨论中推荐的。

尝试再次训练数据集，并使用张量板对其进行监视。我认为您将能够大大减少误报的数量。