tensorflow - 当具有相同图形的示例有效时，DQN无法收敛 - Thinbug

当具有相同图形的示例有效时，DQN无法收敛

时间：2017-03-06 08:19:59

标签： tensorflow deep-learning reinforcement-learning tensorboard

这是问题所在。我尝试重写CartPole-v0的dpn示例。这个例子汇集了不到2000集，然而，我的版本无法收敛。

因此，我使用TensorBoard作为帮助我找出问题的工具。我发现这两个代码具有相同的图形

更重要的是，我发现损失的图表非常不同。 loss of the example loss of mine

我想知道问题是什么。如果有人能帮助我，我将不胜感激！谢谢！

P.S。如果需要代码。我可以上传它们。它们都短于200行。

0 个答案:

没有答案