我需要知道强化学习是否可以应用于人类行为建模,以便我们可以预测未来的人类行为(健康/不健康饮食)? IS Markov模型是一种强化学习? 强化学习可以检测非常罕见的事件吗?
谢谢, Shaima
答案 0 :(得分:0)
RL能否以我们可能的方式应用于人类行为建模 预测未来的人类行为(健康/不健康的饮食)?
是
Markov模型是一种强化学习吗?
大多数RL方法都是基于某种马尔可夫决策过程(MDP),但他们并没有尝试推导出MDP本身(这将是一种基于模型的方法)。
强化学习可以检测非常罕见的事件吗?
是
答案 1 :(得分:0)
关于第一个问题,强化学习并不预测而是在环境中采取行动。您可以将其应用于任何情况,但请记住,您至少需要一个精确的奖励功能。确实,如果您要处理成本,时间或卡路里摄入,那就可以了。但是,如果您尝试衡量患者的健康或幸福,事情就会变得棘手。 此外,您需要环境反馈。每次对他们执行操作时,您都需要能够代表您的人口状况。