我想使用强化学习来编程AI。这场比赛是幽灵! (https://en.wikipedia.org/wiki/Ghosts_(board_game)):
在Ghosts!中,每个玩家都有四个好鬼和四个邪恶鬼魂 - 但只有拥有鬼魂的玩家才能看出它是善还是恶(就像Stratego中的碎片一样)。这些幽灵在6x6游戏板的后排开始游戏,角落被移除。每回合,一名玩家将其中一个鬼魂正方形移动一个方格。进入对手的鬼魂会杀死那个鬼魂。为了获胜,你必须摆脱你自己的邪恶鬼魂,杀死对手的好鬼,或者将你的一个好鬼从一个对手的角落方块移出棋盘。
您将使用哪种算法对AI进行编程?