训练损失图是否显示过度拟合?深度Q学习

时间:2020-03-31 15:35:11

标签: tensorflow reinforcement-learning q-learning

下图是针对时期的训练损失值。基于该图,是否表示我已使其过度拟合?如果不是,是什么导致历时损耗值的峰值?总体而言,可以观察到损耗值呈下降趋势。我该如何在深度Q学习中调整设置?

-

1 个答案:

答案 0 :(得分:1)

这种混乱的损失轨迹通常意味着对于给定的损失函数平滑度,学习率太高。

https://www.jeremyjordan.me/nn-learning-rate/

另一种解释是,损失函数完全不能预测给定任务的成功。