state - 关于强化学习 (RL) 中奖励的问题 - Thinbug

关于强化学习 (RL) 中奖励的问题

时间：2021-02-22 15:26:44

标签： state action reinforcement-learning reward

我有一个关于强化学习奖励的问题。这句话是真的吗？如果是为什么？提前谢谢你

“每次的奖励（对于来自相同状态的相同动作）不需要相同。”

1 个答案:

答案 0 :(得分：0)

对于确定性完美信息博弈，这是真的。想想围棋或国际象棋之类的游戏。但对于其他游戏，相同状态和动作的奖励主要取决于游戏当前的内部状态。