标签: flow-project
我想使用RL算法来训练我的项目。但是我在流目录中找不到该算法,可以使用多少种算法,并且没有关于这些算法的解释性文档,或者如果我想创建一个自定义算法,该怎么做?
答案 0 :(得分:1)
我假设您已经安装了rllib以开始使用Flow进行训练。如果转到agents下的Ray/ray/python/ray/rllib/agents/目录,则可以找到受支持的算法,例如PPO和DDPG。
agents
Ray/ray/python/ray/rllib/agents/