用于赛车的免费模型还是基于模型的深度强化学习?

时间:2019-05-28 08:34:46

标签: reinforcement-learning q-learning

我是强化学习领域的新手。因此,我对“基于模型”或“免费模型”这两个术语感到困惑。

例如,在视频游戏中,如果我想训练一名特工(汽车)在赛道上行驶。

如果我输入的是游戏的256x256x3第一人称图像,我应该使用免费的RL算法吗?

如果我想做同样的事情,但是在跑道上方有第三人称视角,知道坐标,汽车速度和所有障碍物等...,我应该使用基于模型的RL吗?

谢谢您的时间。

1 个答案:

答案 0 :(得分:0)

在基于模型的过程中,您将学习系统动力学的模型,并将其用于计划或生成“假”样本。如果您能很好地学习动态特性,那么它可能会非常有帮助,但是如果您的模型错误,那将是灾难性的。

也就是说,何时使用无模型或基于模型没有通用规则。通常,这取决于您拥有多少先验知识,可以帮助您学习良好的动力学模型。