理解minimax值的定义

时间:2011-03-02 11:03:05

标签: artificial-intelligence definition

在Russell和Norvig的第三版中,他们给出了游戏树中节点的极小极大值的以下定义(零和,完美信息,确定性)

  

节点的极小极大值是处于相应状态的实用程序(对于MAX),假设两个玩家从那里到游戏结束时最佳地

唯一的问题是,在他们的游戏设置中,节点的效用仅为终端节点定义,那么如何理解一般节点的效用呢?谢谢。

2 个答案:

答案 0 :(得分:0)

为非终端节点定义了实用程序。对于终端节点,实用程序是通过一些外部启发式(它们称为UTILITY)来估计的,但对于非终端节点,实用程序是通过minimax算法计算的。非终端节点的极小极大值(或效用)是其子节点的极小极大值的最大值或最小值(取决于它的移动)。如果你和你的对手从那里开始做出最佳动作,那么根的极小极大值将是你将获得的结果的效用。

有一个经过深思熟虑的例子here应该让它更清晰。

答案 1 :(得分:0)

每个节点应代表一个游戏状态,给定每个玩家的一系列动作。

应为每个游戏状态定义实用程序,从而为每个节点定义实用程序。它应该代表游戏状态对玩家的好处。

Minimax树节点计算每隔一层。也就是说,我不会在移动后直接评估游戏的状态,而是在每次我的对手移动后进行评估。

对于双人游戏:

我有X个可能的动作。

对于我的每一个可能的动作,都有一个游戏状态。我们不需要这些游戏状态的实用程序。

对于这些X游戏状态中的每一个,我的对手都有Y可能的移动。

对于每个Y可能的动作,还有另一个游戏状态。我们需要这些游戏状态的实用程序。