标签: python reinforcement-learning openai-gym
对于Atari游戏,A2C是否默认使用“经常性政策”?我发现很难理解他们的高度设计的代码。
答案 0 :(得分:0)
您的意思是默认情况下他们是否在A2C中使用递归神经网络?如果是这样,答案是否定的。默认情况下,他们使用的是自然文件中的CNN。遵循起来有点复杂,但是这个d3.axis documentation在解释代码方面做得很好。