Q-Learning算法可以过度训练吗?

时间:2016-09-04 12:34:44

标签: machine-learning reinforcement-learning q-learning

已经证明Q-Learning算法收敛于最优策略的Qs是唯一的。那么断定Q-Learning算法不会过度训练是否正确?

1 个答案:

答案 0 :(得分:3)

世界上没有过度训练的概念,你认为你有无限访问整个数据(Q-learning假设)。如果你不使用" pure" Q-learning,这是基于状态空间的,但是像深度Q学习这样的一些近似,这可能会严重过度。缺乏这种正确的假设来自不切实际的假设,这些假设通常不会得到满足(除非你的问题极其简单/小)。