使用哪种强化学习模型?

时间:2020-10-19 15:43:38

标签: security machine-learning artificial-intelligence reinforcement-learning

假定我们正在通过强化学习与2个协作代理一起训练环境。我们定义以下示例:有一个中场和一个前锋。中场的报酬取决于打进多少球,但是取决于进攻者的表现。前锋的表现取决于中场球员传球的能力。对于此类问题,您建议学习什么?

0 个答案:

没有答案