在Russell和Norvig的第三版中,他们给出了游戏树中节点的极小极大值的以下定义(零和,完美信息,确定性)
节点的极小极大值是处于相应状态的实用程序(对于MAX),假设两个玩家从那里到游戏结束时最佳地。
唯一的问题是,在他们的游戏设置中,节点的效用仅为终端节点定义,那么如何理解一般节点的效用呢?谢谢。
答案 0 :(得分:0)
为非终端节点定义了实用程序。对于终端节点,实用程序是通过一些外部启发式(它们称为UTILITY)来估计的,但对于非终端节点,实用程序是通过minimax算法计算的。非终端节点的极小极大值(或效用)是其子节点的极小极大值的最大值或最小值(取决于它的移动)。如果你和你的对手从那里开始做出最佳动作,那么根的极小极大值将是你将获得的结果的效用。
有一个经过深思熟虑的例子here应该让它更清晰。
答案 1 :(得分:0)
每个节点应代表一个游戏状态,给定每个玩家的一系列动作。
应为每个游戏状态定义实用程序,从而为每个节点定义实用程序。它应该代表游戏状态对玩家的好处。
Minimax树节点计算每隔一层。也就是说,我不会在移动后直接评估游戏的状态,而是在每次我的对手移动后进行评估。
对于双人游戏:
我有X个可能的动作。
对于我的每一个可能的动作,都有一个游戏状态。我们不需要这些游戏状态的实用程序。
对于这些X游戏状态中的每一个,我的对手都有Y可能的移动。
对于每个Y可能的动作,还有另一个游戏状态。我们需要这些游戏状态的实用程序。