我正在使用张量流和faster_rcnn_inception_v2_coco
模型训练对象检测器,并且在对视频进行分类时遇到很多误报。
经过研究,我发现我需要在训练过程中添加负面图片。
如何将它们添加到tfrecord
文件中?我使用了here教程中提供的csv到tfrecord
文件代码。
还可以看出,ssd在配置中有一个hard_example_miner
,可以配置此行为,但是对于更快的rcnn,似乎不是这种情况吗?有没有办法在更快的rcnn上实现类似的目的?
答案 0 :(得分:2)
我在使用更快的RCNN时也遇到了同样的问题,尽管您不能实际上在更快的RCNN 模型中使用hard_example_miner ,但是您可以添加一些背景图片,即没有对象的图像(除了在xml中没有针对该特定图片的对象标签之外,其他所有内容都保持不变)
实际上对我有用的另一件事是使用 imgaug库,您可以使用相同的脚本增强图像和边界框。尝试将训练数据增加10或15次,然后建议您再次训练到150000-200000步左右。
这两个步骤帮助我有效地减少了误报的次数。