应用错误收集

OpenAI的A2C基线默认使用循环策略吗？

时间：2019-01-29 02:43:40

标签： python reinforcement-learning openai-gym

对于Atari游戏，A2C是否默认使用“经常性政策”？我发现很难理解他们的高度设计的代码。

1 个答案:

答案 0 :(得分：0)

您的意思是默认情况下他们是否在A2C中使用递归神经网络？如果是这样，答案是否定的。默认情况下，他们使用的是自然文件中的CNN。遵循起来有点复杂，但是这个d3.axis documentation在解释代码方面做得很好。