应用错误收集

Q-Learning算法可以过度训练吗？

时间：2016-09-04 12:34:44

标签： machine-learning reinforcement-learning q-learning

已经证明Q-Learning算法收敛于最优策略的Qs是唯一的。那么断定Q-Learning算法不会过度训练是否正确？

1 个答案:

答案 0 :(得分：3)

世界上没有过度训练的概念，你认为你有无限访问整个数据（Q-learning假设）。如果你不使用＆＃34; pure＆＃34; Q-learning，这是基于状态空间的，但是像深度Q学习这样的一些近似，这可能会严重过度。缺乏这种正确的假设来自不切实际的假设，这些假设通常不会得到满足（除非你的问题极其简单/小）。

Q学习算法问题
Q-Learning：你能倒退吗？
Q-Learning算法的实现是递归的吗？
Q学习：改变环境后重新学习
Q学习实施
具有线性函数逼近的Q学习
Q-Learning算法可以过度训练吗？
在Q Learning中，你怎么能真正获得Q值？ Q（s，a）不会永远继续下去吗？
Q学习算法
快速的Q-Learning

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？