deep-learning - 如何选择训练有素的模型（在WIDER FACE数据集上训练的人脸检测）

我尝试训练人脸检测模型（MTCNN）。在训练过程中，分类损失减少，训练批次准确性增加，bbox回归损失也显示如下：
纪元：1，准确性：0.95152992，cls损失：0.12281966，bbox损失：0.01118974，界标损失：0.01776182
纪元：2，准确性：0.97708333，cls损失：0.05861978，bbox损失：0.00678267，界标损失：0.00112470
纪元：3，准确性：0.98011070，cls损失：0.04721076，bbox损失：0.00658322，界标损失：0.00108419
纪元：4，准确性：0.98304039，cls损失：0.04055235，bbox损失：0.00662198，界标损失：0.00106615
纪元：5，准确性：0.98564452，cls损失：0.03602207，bbox损失：0.00659836，界标损失：0.00088186
时期：6，准确性：0.98600262，cls损失：0.03202046，bbox损失：0.00655536，界标损失：0.00087763
纪元：7，准确性：0.98886716，cls损失：0.02739255，bbox损失：0.00661655，界标损失：0.00094789
纪元：8，准确性：0.99003905，cls损失：0.02464939，bbox损失：0.00661948，界标损失：0.00103851
纪元：9，准确性：0.99088544，cls损失：0.02304389，bbox损失：0.00679435，界标损失：0.00105455
纪元：10，准确性：0.99186200，cls损失：0.02017062，bbox损失：0.00689281，界标损失：0.00091911

训练后，我使用WIDER FACE val集比较了模型AP，但是从第2个时期开始训练的模型获得了最佳性能：

Easy Val AP：0.6038928933050102
中值AP：0.6035825841675998
硬值AP：0.38664348551286376

我想知道这里发生了什么，因为最好的模型应该出现在第7至10个纪元。是否过度拟合（ONet是一个非常轻量级的模型，因此通常它无法记住训练集中的所有功能）？我的训练数据集中有大约6,000,000个样本。
那么我应该遵循哪个规则，以便在模型中挑选出最好的一个？任何建议都会有所帮助。谢谢。

如何选择训练有素的模型（在WIDER FACE数据集上训练的人脸检测）

0 个答案: