强化学习Agent在学习很好后崩溃了?

时间:2021-06-11 11:41:14

标签: python pytorch reinforcement-learning

我实际上使用 Python 和 Pytorch 创建了一个强化学习算法,并尝试学习俄罗斯方块游戏。好消息是,我的经纪人学得很好。但是在获得非常高的分数后,代理崩溃并得到一堆 0 分数。我不知道是什么问题。在 0 分之后,智能体会成波地进化。高分和 0 分行。有没有人知道学习算法在什么时候可以做这样的事情?

0 个答案:

没有答案