tensorflow - 训练损失图是否显示过度拟合？深度Q学习 - Thinbug

训练损失图是否显示过度拟合？深度Q学习

时间：2020-03-31 15:35:11

标签： tensorflow reinforcement-learning q-learning

下图是针对时期的训练损失值。基于该图，是否表示我已使其过度拟合？如果不是，是什么导致历时损耗值的峰值？总体而言，可以观察到损耗值呈下降趋势。我该如何在深度Q学习中调整设置？

1 个答案:

答案 0 :(得分：1)

这种混乱的损失轨迹通常意味着对于给定的损失函数平滑度，学习率太高。

另一种解释是，损失函数完全不能预测给定任务的成功。