我正在尝试为自己的游戏创建AI,并且已经实现了回归搜索“面向目标的行动计划者”。
问题归结于我的行动成本的性质,我不知道该用什么作为A *的启发式方法。我读过人们通常会使用一定数量的世界状态来使一个动作有效地成为一种启发式方法。
就我而言,我的行动成本差异很大。例如,战斗的成本约为-3000,平均移动成本为-500,而掠夺敌人的成本约为4000。
请注意,在我的实施中,费用=报酬,因此首选“费用”最高的操作。
我可以扩展世界状态的数量,以获得可能影响计划者的启发式方法,但是我不知道要多少。有没有办法解决这个问题,还是反复试验是我最好/唯一的选择?