security - 使用哪种强化学习模型？ - Thinbug

使用哪种强化学习模型？

时间：2020-10-19 15:43:38

标签： security machine-learning artificial-intelligence reinforcement-learning

假定我们正在通过强化学习与2个协作代理一起训练环境。我们定义以下示例：有一个中场和一个前锋。中场的报酬取决于打进多少球，但是取决于进攻者的表现。前锋的表现取决于中场球员传球的能力。对于此类问题，您建议学习什么？

0 个答案:

没有答案