我正在尝试在openai体育馆设计一个动作空间,并遇到以下障碍。我看过这篇文章(Open AI enviroment with changing action-space after each step),它关系密切,但有细微的差别。
我正在编写的环境需要允许代理在每个步骤中在1
和n
之间进行子操作。由代理决定要执行多少个子操作。像(sub-action-category, sub-action-id, action)
这样的东西,代理可以在1
和n
之间指定这样的元组。
要在不指定形状边界的情况下定义Box
空间似乎是不可能的,这正是我在这里需要的。我试图避免定义一个动作空间,在该空间中,每个子动作都由(action)
元组这样的环境显式枚举,每个子动作都有n
个条目。
我还可以使用其他空间来动态缩放空间吗?