我看到了很多例子,向人们展示了使用深度强化学习的方法,但这是我还不知道的事情,我已经学会了监督训练方法,然后我开始学习Q学习,认为这样做可能会更有效率,我制作了一个运行良好的简单蛇游戏,应用了所有规则,添加了奖励状态和动作,无论需要什么,并使用更新的Q表制作了Q循环,一切正常,并且运行良好(在Tkinter之前没有使用任何库) ,数学和随机数),唯一的问题是,无论经过多少时间,机器都无法真正学习很多东西,表会更新,但我可以肯定,但是从过去的经验来看,我认为Q学习可能不会不适合这种游戏吗?我也从未见过有人通过Q学习制作游戏“ Snake”,因此我想到了……
赞赏每一个评论! :)
(顺便说一句,如果您认为我的代码有错误,可以要求它/部分代码,然后我会打磨,这没什么大不了:P)