OpenAI Gym:了解`action_space`符号(spaces.Box)

时间:2017-06-07 05:33:50

标签: reinforcement-learning openai-gym

我想在OpenAI CarRacing-v0环境中设置RL代理,但在此之前我想了解操作空间。在the code on github第119行中说:

self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1]))  # steer, gas, brake

我如何阅读此行?虽然我的问题是具体的CarRacing-v0我想了解一般的spaces.Box()符号

1 个答案:

答案 0 :(得分:16)

Box表示您正在处理实际数量的数量。

第一个数组np.array([-1,0,0]是最低接受值,第二个np.array([+1,+1,+1])是最高可接受值。在这种情况下(使用评论),我们看到我们有3个可用的操作:

  1. 指导:真值[-1, 1]
  2. 气体:实际值[0, 1]
  3. 制动:实际值[0, 1]