应用错误收集

使用cnn q-近似值建立深度强化学习

时间：2020-03-31 16:59:01

标签： python pytorch reinforcement-learning cnn

我是DRL的新手。从这段代码https://github.com/jaromiru/cwcf开始，我想用CNN替代用于q函数逼近的MLP，但我不知道该怎么做。有谁能够帮助我？谢谢

1 个答案:

答案 0 :(得分：1)

尝试遍历this，其中详细说明了如何构建DQN以解决CartPole问题。您也可以看看this，其中包含许多DRL算法的实现

然后，您可以使用DQN代理代码替换回购中存在的agent.py中的代码