一步多动作,强化学习

时间:2021-03-16 08:38:10

标签: reinforcement-learning openai-gym ray rllib

我正在尝试编写一个自定义的 openAI Gym 环境,其中代理在每个步骤中采取 2 个动作,其中一个是离散动作,另一个是连续动作。我正在使用 Ray RLLib 并使用 SAC 算法,因为它支持离散和连续动作空间。 我的问题是有人知道如何让代理每一步采取两个动作,一个是连续的,另一个是离散的

0 个答案:

没有答案