我已经使用tensorflow API通过此处描述的过程-https://pythonprogramming.net/introduction-use-tensorflow-object-detection-api-tutorial/检测吉尼斯竖琴。
大多数情况下,我的效果都很好,只要徽标在图像中清晰可见就可以很好地找到它-
但是,从可可检查站进行再培训之后,它仍然可以检测到我认为是具有很高置信度的可可物体,即人,杂志。我不知道为什么会这样。
(见下文)
我正在使用在此处找到的fast_rcnn_inception_v2_coco.config-https://github.com/tensorflow/models/blob/master/research/object_detection/samples/configs/faster_rcnn_inception_v2_coco.config
训练更多步骤似乎无济于事,因为总损失平均起来。上面的屏幕截图来自10,000个培训步骤。我正在训练CPU。
我正在使用imgaug扩充训练图像,下面可以看到一个训练图像示例(我在目标周围包括了调试边界框)-
但是,如果训练图像出了问题,图形是否就不会完全检测到目标呢?
答案 0 :(得分:0)
最近,我遇到了一个类似的问题,从某种程度上来说,这似乎是拟合不足的一个例子,我尝试了多种方法来改善结果。
对我有用的实际上是使用库 imgaug 扩充数据。您可以使用简单的脚本扩展图像和边界框,尝试将数据集增加10/12倍。
我还建议添加一些背景图片,即。没有对象的图像,这是一些人在有关张量流的讨论中推荐的。
尝试再次训练数据集,并使用张量板对其进行监视。我认为您将能够大大减少误报的数量。