应用错误收集

我正在尝试使用alpha-beta修剪为特定的零和棋盘游戏构建AI代理。由于某些时间限制，该程序将受到深度限制，因此我需要使用良好的评估功能。游戏如下

这是一个双人游戏，每个玩家都试图最大化他/她从随机放在一个盒子里的一批糖果中分享。盒子是分成细胞，每个细胞是空的或用一个细胞填充特定类型的糖果。在每场比赛开始时，所有的细胞都是装满糖果。玩家轮流玩，可以选择一个单元格盒子在他们自己的轮到并声称所有相同类型的糖果通过水平和连接到所选单元格的单元格垂直路径。对于每个选择或移动，代理都会获得奖励数值，即所声称的糖果数的平方那一步。一旦代理人从细胞中挑选糖果，他们就会空着地方将充满其他糖果（倒下由于重力），如果有的话。在这个游戏中，没有添加糖果游戏。因此，玩家一直玩，直到所有糖果都被声称。

鉴于上述游戏玩法，有人可以帮助我获得游戏的良好评估功能吗？我想到的一个想法是获得可以从给定的板状态声明的最大数量的水果作为启发式/评估函数。但是，这不是一个很好的评估函数。什么可能更好？

具有Alpha Beta修剪的游戏Minmax Agent的良好评估功能

0 个答案: