应用错误收集

强化学习和人类行为预测？

时间：2018-05-02 13:56:17

标签： reinforcement-learning behaviorsubject

我需要知道强化学习是否可以应用于人类行为建模，以便我们可以预测未来的人类行为（健康/不健康饮食）？ IS Markov模型是一种强化学习？强化学习可以检测非常罕见的事件吗？

谢谢， Shaima

2 个答案:

答案 0 :(得分：0)

RL能否以我们可能的方式应用于人类行为建模预测未来的人类行为（健康/不健康的饮食）？

是

Markov模型是一种强化学习吗？

大多数RL方法都是基于某种马尔可夫决策过程（MDP），但他们并没有尝试推导出MDP本身（这将是一种基于模型的方法）。

强化学习可以检测非常罕见的事件吗？

是

答案 1 :(得分：0)

关于第一个问题，强化学习并不预测而是在环境中采取行动。您可以将其应用于任何情况，但请记住，您至少需要一个精确的奖励功能。确实，如果您要处理成本，时间或卡路里摄入，那就可以了。但是，如果您尝试衡量患者的健康或幸福，事情就会变得棘手。此外，您需要环境反馈。每次对他们执行操作时，您都需要能够代表您的人口状况。