标签: sarsa
我正在上Cousera强化学习课程,并且对这个多项选择题感到困惑。我尝试了40多个不同的答案,但都做错了。非常感谢对此的任何提示。谢谢!
什么时候SARSA比预期的SARSA好?
1,在状态空间太大的情况下,我们无法对巨大状态空间的近似值进行积分。
2,在无法计算对策略随机性的明确期望的情况下。
3,在我们有很多参数W的情况下。
4,在只有几个参数W的情况下。
5,在伽玛值太大的情况下。
6,在动作空间太大的情况下,我们无法对巨大的动作空间进行近似积分。