应用错误收集

我正在尝试在openai体育馆设计一个动作空间，并遇到以下障碍。我看过这篇文章（Open AI enviroment with changing action-space after each step），它关系密切，但有细微的差别。

我正在编写的环境需要允许代理在每个步骤中在1和n之间进行子操作。由代理决定要执行多少个子操作。像(sub-action-category, sub-action-id, action)这样的东西，代理可以在1和n之间指定这样的元组。

要在不指定形状边界的情况下定义Box空间似乎是不可能的，这正是我在这里需要的。我试图避免定义一个动作空间，在该空间中，每个子动作都由(action)元组这样的环境显式枚举，每个子动作都有n个条目。

我还可以使用其他空间来动态缩放空间吗？