改进蒙特卡罗树搜索中的默认策略(推出策略)

时间:2016-01-20 03:41:46

标签: python python-3.x tree artificial-intelligence montecarlo

我已经在python中编写了MCTS AI,现在,我正在尝试改进它的第一次迭代。我被告知我需要改进我的推出功能。人工智能的目的是玩点和盒子的游戏。

现在,在收到游戏状态后,首次展示只会播放剩余的游戏。

转出:

    while not state.is_terminal:
        state.apply_move(choice(state.legal_moves))

我想知道如何通过改变推出功能来改进AI?

1 个答案:

答案 0 :(得分:0)

在点中一个随机播放的盒子可能很差,因为它会(1)错过填充盒子的机会和(2)给对手填充盒子的机会,这两者都使得播放不像真正的游戏。

因此,最简单的改变是在播出中命令移动。首先,如果可能的话,采取随机移动填充框。其次,采取随机动作,不会让对手有机会填补一个盒子。最后,让对手有机会填补一个盒子。 (但是,在这里你可能想要选择一个让对手最小区域充满概率的移动。)