OpenAI的A2C基线默认使用循环策略吗?

时间:2019-01-29 02:43:40

标签: python reinforcement-learning openai-gym

对于Atari游戏,A2C是否默认使用“经常性政策”?我发现很难理解他们的高度设计的代码。

1 个答案:

答案 0 :(得分:0)

您的意思是默认情况下他们是否在A2C中使用递归神经网络?如果是这样,答案是否定的。默认情况下,他们使用的是自然文件中的CNN。遵循起来有点复杂,但是这个d3.axis documentation在解释代码方面做得很好。