应用错误收集

每10k-12k步骤使用ssd_mobilenet_v2_quantized_300x300_coco的对象检测模型的丢失增加

时间：2019-03-10 06:07:45

标签： python tensorflow computer-vision object-detection

我正在自定义数据集上训练ssd_mobilenet_v2_quantized_300x300_coco对象检测模型。该数据集包含约2.6k图像和19个类别。训练步骤达到10k-12k后，损耗图开始增加。即使我在相同的步距范围内将模型更改为ssd_mobilenet_v2_coco，也会发生这种情况。我在配置文件中找不到与此行为相关的任何内容。当使用faster_rcnn模型时，也会消失。当问题出现时，mAP几乎变得恒定。准确度也不会超过50％。谁能解释这种行为？

样本数据集：

损失图

a）ssd_mobilenet_v2_quantized_300x300_coco

b）ssd_mobilenet_v2_coco

配置文件： a）ssd_mobilenet_v2_quantized_300x300_coco

https://pastebin.com/BBwqEruK

b）ssd_mobilenet_v2_coco

https://pastebin.com/F8K0BhQV

1 个答案:

答案 0 :(得分：0)

您的训练损失如何？请注意，total_loss是此处的验证损失。

如果您的训练损失减少而验证损失增加，这显然是过度拟合的迹象，您可以在训练期间通过在配置文件的train_config部分中添加以下内容来使用正则化损失：

add_regularization_loss: true

与batch_size: 24