我一直在尝试在faster_rcnn_inception_resnet_v2_atrous
之上训练一个物体检测管道以识别单个类,但在同一图像上多次识别。我的目标是能够计算每个图像上有多少个实例,而不是确切知道图像上的内容和内容。
训练数据集是20张图像,每张图像约300个盒子,评估图像也是如此。
我无法让管道在每张图像上检测超过20个实例,即使在原始训练上也是如此,无论在200k训练步骤之后损失有多小。
我已经配置了管道
first_stage_max_proposals: 2000
和
max_detections_per_class: 500
max_total_detections: 500
但似乎没有任何改变20个检测到的盒子的限制;也没有增加更多培训步骤。
有什么建议吗?
编辑:评估工具有自己的设置,可以在每个样本图像上打印多少个最大框;默认为20.当我提出问题时,它甚至在设置中都没有,但在评估代码中丢失了。现在它以eval_config.max_num_boxes_to_visualize
答案 0 :(得分:0)
这些物体彼此非常接近吗?对象检测API使用nms来抑制重叠超过某个阈值的框