reinforcement-learning - 一步多动作，强化学习

一步多动作，强化学习

时间：2021-03-16 08:38:10

标签： reinforcement-learning openai-gym ray rllib

我正在尝试编写一个自定义的 openAI Gym 环境，其中代理在每个步骤中采取 2 个动作，其中一个是离散动作，另一个是连续动作。我正在使用 Ray RLLib 并使用 SAC 算法，因为它支持离散和连续动作空间。我的问题是有人知道如何让代理每一步采取两个动作，一个是连续的，另一个是离散的？

0 个答案:

没有答案

用可变动作强化学习
强化学习
强化学习中的无效动作
强化学习，步步为营
强化学习中的动作变化限制
强化学习的时间步骤
keras强化学习-具有多个输出的动作
如何处理强化学习中的同步动作
一步多动作，强化学习
强化学习参数化动作空间

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？