是否有人在不使用开放式AI体育馆的情况下拥有或知道任何可以教授q学习的教程/课程。 我正在尝试建立卷积q学习模型,并且使用pytorch和开放式AI健身房轻松做到这一点没有问题!但是当我尝试将其全部应用到不在开放式AI健身房中的环境中时,情况就完全不同了,尝试将其应用于并非Atari的其他游戏中,这样我就无法访问env.reset和所有这些其他不错的选择,它成为一种全新的球类游戏。如果有人知道一个学习的地方,或者谁愿意教我/帮助我,我也很乐意为任何帮助付费。 谢谢。
答案 0 :(得分:0)
您可以使用环境代码(例如游戏),然后实现算法。
但是请考虑在代码中明确表述奖励和行动。为每个动作返回奖励。
如果要在不使用Gym的情况下启动RL。尝试做一个简单的游戏并实现NEAT算法。然后尝试实施Q学习并修改您的代码以为每个操作添加奖励。