应用错误收集

时间：2019-05-28 08:34:46

标签： reinforcement-learning q-learning

我是强化学习领域的新手。因此，我对“基于模型”或“免费模型”这两个术语感到困惑。

例如，在视频游戏中，如果我想训练一名特工（汽车）在赛道上行驶。

如果我输入的是游戏的256x256x3第一人称图像，我应该使用免费的RL算法吗？

如果我想做同样的事情，但是在跑道上方有第三人称视角，知道坐标，汽车速度和所有障碍物等...，我应该使用基于模型的RL吗？

谢谢您的时间。

答案 0 :(得分：0)

在基于模型的过程中，您将学习系统动力学的模型，并将其用于计划或生成“假”样本。如果您能很好地学习动态特性，那么它可能会非常有帮助，但是如果您的模型错误，那将是灾难性的。

也就是说，何时使用无模型或基于模型没有通用规则。通常，这取决于您拥有多少先验知识，可以帮助您学习良好的动力学模型。