对于Tic Tac Toe,我的讲师已经提出了一个可接受的启发式(意思是它永远不会高估距离),以便在Tic Tac Toe进行下一步行动(从O玩家的角度来看):
O的可能行数 - X的可能行数
我想知道为什么这种启发式可以接受?
答案 0 :(得分:2)
不是。
O..
XOX
OX.
然后到目标的距离=(3-1)= 2
与目标的实际距离,1(由O
获胜)
2> 1,因此它高估了。
或者我错过了什么?
答案 1 :(得分:0)
来自Wikipedia:
如果启发函数永远不会高估达到目标的成本,那么它就被认为是可接受的
这基本上意味着,当你有一个启发式时,只有当目标的实际成本保证高于或等于估计成本时才允许这样做。一个很好的例子是A *路径寻找算法的启发式算法。对于该算法,您通常使用一种启发式方法来估计到目标的距离,就像直接到达目标的道路一样。如果你使用一种会高估距离的启发式算法,它可能找不到最短路径。