使用cnn q-近似值建立深度强化学习

时间:2020-03-31 16:59:01

标签: python pytorch reinforcement-learning cnn

我是DRL的新手。从这段代码https://github.com/jaromiru/cwcf开始,我想用CNN替代用于q函数逼近的MLP,但我不知道该怎么做。有谁能够帮助我?谢谢

1 个答案:

答案 0 :(得分:1)

尝试遍历this,其中详细说明了如何构建DQN以解决CartPole问题。您也可以看看this,其中包含许多DRL算法的实现

然后,您可以使用DQN代理代码替换回购中存在的agent.py中的代码