Openai-gym定义操作人员可以在一个步骤中执行多个子操作时的操作空间

时间:2019-07-09 13:14:12

标签: reinforcement-learning openai-gym

我正在尝试在openai体育馆设计一个动作空间,并遇到以下障碍。我看过这篇文章(Open AI enviroment with changing action-space after each step),它关系密切,但有细微的差别。

我正在编写的环境需要允许代理在每个步骤中在1n之间进行子操作。由代理决定要执行多少个子操作。像(sub-action-category, sub-action-id, action)这样的东西,代理可以在1n之间指定这样的元组。

要在不指定形状边界的情况下定义Box空间似乎是不可能的,这正是我在这里需要的。我试图避免定义一个动作空间,在该空间中,每个子动作都由(action)元组这样的环境显式枚举,每个子动作都有n个条目。

我还可以使用其他空间来动态缩放空间吗?

0 个答案:

没有答案