标签: reinforcement-learning openai-gym
我想使用OpenAI Gym解决持续环境,即单个无休止情节的问题(请注意,我并不是说 continuous < / em>具有连续状态和动作的环境。
我在他们的存储库中发现的唯一连续环境是经典的inverted pendulum problem,而且我发现没有不需要情景环境的基准方法(算法)。
所以我有两个问题:
除了倒立摆之外,还有其他连续的环境吗?
是否可以使用OpenAI Gym基线方法来解决倒立摆问题以及其他连续环境?