标签: artificial-intelligence reinforcement-learning q-learning
在阅读了一些教程之后,我仍然不确定任何一集的定义。剧集是否定义为从开始状态到退出/目标状态的一个步骤?
答案 0 :(得分:1)
这取决于任务/环境。在有明确定义的退出/目标状态(可能还有其他类型的终端状态,如失败状态)的任务中,是的,这可能是一集。
通常,还会有一个时间限制(例如,如果经过一定时间后剧集将被终止,无论成功/失败。
基本上,无论谁指定问题也可以选择如何定义一集,它并不总是以相同的方式定义。