与Q学习情节定义混淆

时间:2018-02-22 21:24:14

标签: artificial-intelligence reinforcement-learning q-learning

在阅读了一些教程之后,我仍然不确定任何一集的定义。剧集是否定义为从开始状态到退出/目标状态的一个步骤?

1 个答案:

答案 0 :(得分:1)

这取决于任务/环境。在有明确定义的退出/目标状态(可能还有其他类型的终端状态,如失败状态)的任务中,是的,这可能是一集。

通常,还会有一个时间限制(例如,如果经过一定时间后剧集将被终止,无论成功/失败。

基本上,无论谁指定问题也可以选择如何定义一集,它并不总是以相同的方式定义。