CNN中这种训练损耗曲线的原因可能是什么?

时间:2018-07-13 00:45:24

标签: deep-learning computer-vision

我已经训练了CNN进行图像分类,但是得到的损失曲线如下,x轴是历元,y轴是损失,学习率太大还是太小?我只是用亚当,而LR是0.001。
loss curve

2 个答案:

答案 0 :(得分:1)

您的模型可能是过度拟合的,这意味着学习模式没有被概括。尽管减少是训练损失的好选择,但它表明您的模型学习为否。时代增加,但真正的代表学习可以通过外观验证损失曲线找到。

要解决过度拟合问题,您可以添加Dropout层,该层随机选择一些隐藏的单位并将其权重设置为零。这也可能是因为您要训练的数据较少。

关于此主题,还有其他几件事需要学习。

答案 1 :(得分:0)

修改图以显示验证损失曲线。您只能通过同时分析验证曲线和训练曲线来确定模型的拟合度。

您可以在此处了解如何分析曲线:https://machinelearningmastery.com/learning-curves-for-diagnosing-machine-learning-model-performance/