我正在自定义数据集上训练ssd_mobilenet_v2_quantized_300x300_coco
对象检测模型。该数据集包含约2.6k图像和19个类别。训练步骤达到10k-12k后,损耗图开始增加。即使我在相同的步距范围内将模型更改为ssd_mobilenet_v2_coco
,也会发生这种情况。我在配置文件中找不到与此行为相关的任何内容。当使用faster_rcnn
模型时,也会消失。当问题出现时,mAP几乎变得恒定。准确度也不会超过50%。谁能解释这种行为?
样本数据集:
损失图
a)ssd_mobilenet_v2_quantized_300x300_coco
b)ssd_mobilenet_v2_coco
配置文件: a)ssd_mobilenet_v2_quantized_300x300_coco
b)ssd_mobilenet_v2_coco
答案 0 :(得分:0)
您的训练损失如何?请注意,total_loss
是此处的验证损失。
如果您的训练损失减少而验证损失增加,这显然是过度拟合的迹象,您可以在训练期间通过在配置文件的train_config
部分中添加以下内容来使用正则化损失:
add_regularization_loss: true
与batch_size: 24