应用错误收集

DoubleDQN和DQN之间的性能比较

时间：2019-07-05 09:32:18

标签： reinforcement-learning q-learning

我在健身房NChain游戏中尝试了DoubleDQN和DQN算法，并意识到DoubleDQN的性能并没有比DQN稳定或更好。

我将每次执行操作后的训练批量设置为1。我是否可以知道这是DoubleDQN不能胜过DQN的原因吗？

Result Comparison

1 个答案:

答案 0 :(得分：0)

您的两个网络似乎都没有学到任何东西，或者环境没有引起乐观的Q值。 n链的原始结果为 3643 。 A Bayesian Framework for Reinforcement Learning

在atari中，Dobule DQN在大多数游戏中都优于DQN，但在少数游戏中却有较差的结果。