我是强化学习领域的新手。因此,我对“基于模型”或“免费模型”这两个术语感到困惑。
例如,在视频游戏中,如果我想训练一名特工(汽车)在赛道上行驶。
如果我输入的是游戏的256x256x3第一人称图像,我应该使用免费的RL算法吗?
如果我想做同样的事情,但是在跑道上方有第三人称视角,知道坐标,汽车速度和所有障碍物等...,我应该使用基于模型的RL吗?
谢谢您的时间。
答案 0 :(得分:0)
在基于模型的过程中,您将学习系统动力学的模型,并将其用于计划或生成“假”样本。如果您能很好地学习动态特性,那么它可能会非常有帮助,但是如果您的模型错误,那将是灾难性的。
也就是说,何时使用无模型或基于模型没有通用规则。通常,这取决于您拥有多少先验知识,可以帮助您学习良好的动力学模型。