Question

对于Tic Tac Toe，我的讲师已经提出了一个可接受的启发式（意思是它永远不会高估距离），以便在Tic Tac Toe进行下一步行动（从O玩家的角度来看）：

O的可能行数 - X的可能行数

我想知道为什么这种启发式可以接受？

Answer 1

不是。

O..
XOX
OX.

然后到目标的距离=（3-1）= 2

与目标的实际距离，1（由O获胜）

2＆gt; 1，因此它高估了。

或者我错过了什么？

Answer 2

如果启发函数永远不会高估达到目标的成本，那么它就被认为是可接受的

这基本上意味着，当你有一个启发式时，只有当目标的实际成本保证高于或等于估计成本时才允许这样做。一个很好的例子是A *路径寻找算法的启发式算法。对于该算法，您通常使用一种启发式方法来估计到目标的距离，就像直接到达目标的道路一样。如果你使用一种会高估距离的启发式算法，它可能找不到最短路径。