每10k-12k步骤使用ssd_mobilenet_v2_quantized_300x300_coco的对象检测模型的丢失增加

时间:2019-03-10 06:07:45

标签: python tensorflow computer-vision object-detection

我正在自定义数据集上训练ssd_mobilenet_v2_quantized_300x300_coco对象检测模型。该数据集包含约2.6k图像和19个类别。训练步骤达到10k-12k后,损耗图开始增加。即使我在相同的步距范围内将模型更改为ssd_mobilenet_v2_coco,也会发生这种情况。我在配置文件中找不到与此行为相关的任何内容。当使用faster_rcnn模型时,也会消失。当问题出现时,mAP几乎变得恒定。准确度也不会超过50%。谁能解释这种行为?

样本数据集:

enter image description here

损失图

a)ssd_mobilenet_v2_quantized_300x300_coco ssd_mobilenet_v2_quantized_300x300_coco

b)ssd_mobilenet_v2_coco

enter image description here

配置文件: a)ssd_mobilenet_v2_quantized_300x300_coco

https://pastebin.com/BBwqEruK

b)ssd_mobilenet_v2_coco

https://pastebin.com/F8K0BhQV

1 个答案:

答案 0 :(得分:0)

您的训练损失如何?请注意,total_loss是此处的验证损失。

如果您的训练损失减少而验证损失增加,这显然是过度拟合的迹象,您可以在训练期间通过在配置文件的train_config部分中添加以下内容来使用正则化损失:

add_regularization_loss: true

batch_size: 24