我正在尝试使用alpha-beta修剪为特定的零和棋盘游戏构建AI代理。由于某些时间限制,该程序将受到深度限制,因此我需要使用良好的评估功能。游戏如下
这是一个双人游戏,每个玩家都试图最大化他/她 从随机放在一个盒子里的一批糖果中分享。盒子是 分成细胞,每个细胞是空的或用一个细胞填充 特定类型的糖果。在每场比赛开始时,所有的细胞都是 装满糖果。玩家轮流玩,可以选择一个单元格 盒子在他们自己的轮到并声称所有相同类型的糖果 通过水平和连接到所选单元格的单元格 垂直路径。对于每个选择或移动,代理都会获得奖励 数值,即所声称的糖果数的平方 那一步。一旦代理人从细胞中挑选糖果,他们就会空着 地方将充满其他糖果(倒下 由于重力),如果有的话。在这个游戏中,没有添加糖果 游戏。因此,玩家一直玩,直到所有糖果都被声称。
鉴于上述游戏玩法,有人可以帮助我获得游戏的良好评估功能吗?我想到的一个想法是获得可以从给定的板状态声明的最大数量的水果作为启发式/评估函数。但是,这不是一个很好的评估函数。什么可能更好?