minimax算法的描述说,两个玩家必须发挥最佳效果,因此算法是最佳的。直觉上它是可以理解的。但是任何人都应该保持冷静,或证明如果min不是最佳的话会发生什么?
THX
答案 0 :(得分:2)
“最佳”的定义是你玩的最小化对手的最佳答案的“得分”(或你测量的任何东西),这是由最小化你的最佳答案得分的游戏定义的等等。
因此,根据定义,如果你没有发挥最佳状态,你的对手至少有一条路径,如果你打出最佳状态,会给他一个高于他最高分的分数。
找出最佳选择的一种方法是强制整个游戏树。对于不太琐碎的问题,您可以使用alpha-beta搜索,这可以保证最佳,而无需搜索整个树。如果你的树仍然太复杂,你需要一个启发式方法来估计“位置”的分数是什么,并在某个深度停止。
那可以理解吗?
答案 1 :(得分:1)
我遇到了这个问题的问题。
当你稍微考虑一下时,你会发现minimax图包含所有可能的游戏,包括糟糕的游戏。因此,如果一个玩家玩一个次优游戏,那么该游戏就是树的一部分 - 但是被丢弃以支持更好的游戏。
它类似于alpha beta。如果我故意牺牲一些碎片来创造空间然后通过这个间隙取得胜利,我就会陷入困境。也就是说树下面有更好的移动。
使用alpha beta - 让我们说一系列失败的移动然后杀手移动实际上是在树中 - 但在这种情况下,alpha和beta充当窗口过滤器“a< x< b”并且会有如果你有更好的比赛,就放弃它。你可以在alpha beta中看到它,如果你想象将+/-无穷大放入一个被修剪的分支中,看看会发生什么。
在任何情况下,两种算法都会重新计算每次移动,这样如果玩家玩次优游戏,它们就会打开图表中对对手更好的分支。
冲洗重复。
答案 2 :(得分:0)
考虑一个MIN节点,其子节点为终端节点。如果MIN播放效果不佳,则节点的值大于或等于MIN播放效果最佳时的值。因此,只能增加作为MIN节点父节点的MAX节点的值。可以通过简单的归纳方法一直扩展到根。如果MIN的次优策略是可以预测的,那么比起minimax策略,它可以做得更好。例如,如果MIN总是因为某种陷阱而掉落并输了,那么即使实际上对MIN的毁灭性反应,设置陷阱也能确保获胜。