如何选择训练有素的模型(在WIDER FACE数据集上训练的人脸检测)

时间:2020-07-01 17:26:02

标签: deep-learning face-detection

我尝试训练人脸检测模型(MTCNN)。在训练过程中,分类损失减少,训练批次准确性增加,bbox回归损失也显示如下:
纪元:1,准确性:0.95152992,cls损失:0.12281966,bbox损失:0.01118974,界标损失:0.01776182
纪元:2,准确性:0.97708333,cls损失:0.05861978,bbox损失:0.00678267,界标损失:0.00112470
纪元:3,准确性:0.98011070,cls损失:0.04721076,bbox损失:0.00658322,界标损失:0.00108419
纪元:4,准确性:0.98304039,cls损失:0.04055235,bbox损失:0.00662198,界标损失:0.00106615
纪元:5,准确性:0.98564452,cls损失:0.03602207,bbox损失:0.00659836,界标损失:0.00088186
时期:6,准确性:0.98600262,cls损失:0.03202046,bbox损失:0.00655536,界标损失:0.00087763
纪元:7,准确性:0.98886716,cls损失:0.02739255,bbox损失:0.00661655,界标损失:0.00094789
纪元:8,准确性:0.99003905,cls损失:0.02464939,bbox损失:0.00661948,界标损失:0.00103851
纪元:9,准确性:0.99088544,cls损失:0.02304389,bbox损失:0.00679435,界标损失:0.00105455
纪元:10,准确性:0.99186200,cls损失:0.02017062,bbox损失:0.00689281,界标损失:0.00091911

训练后,我使用WIDER FACE val集比较了模型AP,但是从第2个时期开始训练的模型获得了最佳性能:

Easy Val AP:0.6038928933050102
中值AP:0.6035825841675998
硬值AP:0.38664348551286376

我想知道这里发生了什么,因为最好的模型应该出现在第7至10个纪元。是否过度拟合(ONet是一个非常轻量级的模型,因此通常它无法记住训练集中的所有功能)?我的训练数据集中有大约6,000,000个样本。
那么我应该遵循哪个规则,以便在模型中挑选出最好的一个?任何建议都会有所帮助。谢谢。

0 个答案:

没有答案