我正在制作一个expectimax AI,这个游戏的分支因素是不可预测的,范围从6到20.我现在每回合探索游戏树1秒,然后确保整个游戏树是探索到相同的深度,但偶尔会导致非常大的减速,如果特定转弯的分支因素急剧上升。如果我在游戏树的某些部分没有深入探索时切断了探索,那是否可以?这会影响expectimax的数学属性吗?
答案 0 :(得分:0)
简短的回答:我很确定你失去了数学保证,但这会影响你的程序性能的程度可能取决于游戏和你的评估板功能。
这是一个抽象的场景,可以让你对不同分支长度可能产生最多问题的地方有所了解:比方说,对于第一个玩家来说,最好的动作是需要几次设置的东西。假设这个设置不是您的电路板评估功能可以接受的。在这种情况下,无论玩家2在同一时间做什么,将来会有一些动作,董事会的得分将朝着有利于玩家1的方向摆动。如果一个分支足够远看虽然事实上在另一个分支上会发生同样的事情,但是那个移动而另一个没有,看起来第一个对于玩家2来说是更糟糕的选择。如果玩家2在第一个分支中做出的移动实际上比在第二个分支中做出的移动更好,这将导致次优选择。
另一方面,一个完美的董事会评估员会让这个变得不可能(它会认出玩家1设置他们的行动)。还有一些游戏可以提前设置动作,这是不可能的。但这个案件的存在是一个危险信号。
从根本上说,到目前为止没有得到评估的分支机构在对移动有多好的估计方面存在更大的不确定性。这有时会导致他们在不应该被选中时被选中,有时候会导致他们在被选中时被选中。因此,我强烈怀疑你这样做会失去数学保证。 。也就是说,这个问题对绩效的实际影响可能会或可能不会很大。
如果将当前转弯编号合并到电路板评估功能中并相应地进行调整,可能会有一些方法。最低限度,这将允许您明确说明较短分支中增加的不确定性。