我的问题类似于Tensorflow Object Detection API does not detect objects correctly/does not detect objects at all,但它是一个不同的用例,这个问题没有解决。
我正在使用对象检测API进行迁移学习,以识别人脸(1类)。正在使用的预训练模型是ssd_mobilenet_v1_coco_11_06_2017。它运行了1.5个小时,并进行了3500次迭代,损失约为4.5(按预期,前几次迭代急剧下降,所以我认为这不是最佳模型,但我应该得到明显的结果)
然后,我使用最新的检查点,导出的推理图,对object_detection_tutorial笔记本进行了修改。但这只是输出我的测试图像而没有任何边界框(注意:-原始笔记本可以正常运行,并且我能够看到这些框,因此我的猜测是我的模型存在一些问题,我无法弄清楚)< / p>
我正在粘贴用于调试的结果。好像边界框的坐标为1和0。我还通过更改visualization_utils.py中的min_score_thresh进行操作,但这也无济于事。
配置文件摘录(对示例进行了修改。将num_classes更改为1,并获取了我相关文件的路径)
model {
ssd {
num_classes: 1
box_coder {
faster_rcnn_box_coder {
y_scale: 10.0
x_scale: 10.0
height_scale: 5.0
width_scale: 5.0
}
fine_tune_checkpoint: "ssd_mobilenet_v1_coco_11_06_2017/model.ckpt"
train_input_reader: {
tf_record_input_reader {
input_path: "training/train.record"
}
label_map_path: "training/face-detection.pbtxt"
}
detection_boxes的示例输出
array([[0. , 0.2554323 , 1. , 0.7534608 ],
[0.3012189 , 0. , 0.70924723, 1. ],
[0.18439636, 0. , 0.817055 , 1. ],
[0.05466348, 0.06271043, 0.95918256, 0.94578576],
[0.5260097 , 0.07892245, 0.97103214, 1. ],
[0.27985883, 0.5130247 , 1. , 1. ],
[0. , 0.41663095, 0.5991725 , 1. ],
[0.03816789, 0. , 0.4441032 , 1. ],
[0. , 0.5875985 , 1. , 0.9825353 ],
[0.5518031 , 0. , 0.9699122 , 0.9448744 ],
[0. , 0. , 0.6656574 , 0.7552371 ],
[0. , 0.07883103, 1. , 0.49962282],
[0.04292154, 0.57037276, 1. , 0.9573701 ],
[0.05089287, 0.00120801, 0.46899152, 1. ],
[0.43095234, 0.31733978, 1. , 1. ],
detection_classess的输出
[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
detection_scores的样本输出得分低,但是更改阈值无济于事
3.20677400e-01, 3.19893241e-01, 3.14980447e-01, 3.09631795e-01,
2.53045678e-01, 2.52637416e-01, 2.52323598e-01, 2.41894022e-01,
2.40268022e-01, 2.40083978e-01, 2.36307651e-01, 2.15435311e-01,
2.14362189e-01, 2.13490084e-01, 2.12984398e-01, 2.10590839e-01,
2.03191489e-01, 1.66917413e-01, 1.64012805e-01, 1.60537049e-01,
6.71069846e-02, 6.55404702e-02, 3.69835161e-02, 3.63573395e-02,
3.15450728e-02, 2.46258732e-02, 2.34935526e-02, 2.04152763e-02,
1.82382613e-02, 1.56786684e-02, 1.50712561e-02, 1.47904372e-02,
1.45556601e-02, 1.41305756e-02, 1.14051756e-02, 1.02278581e-02,
9.46425926e-03, 8.77886359e-03, 8.67216382e-03, 7.98975583e-03