标签: python pytorch reinforcement-learning cnn
我是DRL的新手。从这段代码https://github.com/jaromiru/cwcf开始,我想用CNN替代用于q函数逼近的MLP,但我不知道该怎么做。有谁能够帮助我?谢谢
答案 0 :(得分:1)
尝试遍历this,其中详细说明了如何构建DQN以解决CartPole问题。您也可以看看this,其中包含许多DRL算法的实现
然后,您可以使用DQN代理代码替换回购中存在的agent.py中的代码