如何为nim游戏python编写minimax算法?

时间:2018-02-23 23:00:16

标签: python recursion tree minimax

我试图在python中编写一个minimax算法。但它太令人困惑了。我是递归函数的新手。我的思维结构在某个地方有一些错误,但我无法解决它。我的minimax树返回'-100',必须为100才能获得真正的答案。如果遗漏或不清楚,请告诉我。谢谢

def startposition():
    return 2, 'max'


def terminalstate(state):
    if state == (0, 'min') or state == (0, 'max'):
        return True
    else:
        return False


def minimax(state):
    if terminalstate(state):
        return utilitystatic(state)
    else:
        if state[1] == 'min':
            value = -250
            for x in successorsgenerator(state):
                value = max(value, minimax(x))
        elif state[1] == 'max':
            value = 250
            for x in successorsgenerator(state):
                value = min(value, minimax(x))
    return value
def utilitystatic(state):
    assert terminalstate(state)
    if state[1] == 'max':
        return -100
    elif state[1] == 'min':
        return 100
    assert False


def successorsgenerator(state):
    successors = []
    state = toggle(state)
    newstate = decrease(state)
    i = 0
    while newstate[0] >= 0 and i < 3:
        successors.append(newstate)
        i += 1
        newstate = decrease(newstate)

    print('successors:', successors)
    return successors


def toggle(state):
    state = list(state)
    state[1] = 'min' if state[1] == 'max' else 'max'
    state = tuple(state)
    return state


def decrease(state):
    state = state[:0] + (state[0] - 1,) + state[1:2]
    return state


stick = startposition()
exit = minimax(stick)
print('last result', exit)

2 个答案:

答案 0 :(得分:1)

如果最小玩家先行,则从最大玩家的角度来看代码是正确的。 minimax的工作方式,min层应该返回所有可能状态的最小值(因为min玩家也在优化他们的移动)。因此,您不应该切换最小和最大呼叫,而应该首先选择哪个播放器。

这是你的状态树可视化:https://imgur.com/a/0iRFc.jpg(我显然没有足够的代表来显示图像)。递归的顶层将采用

max(-250, -100)

并返回-100。因为游戏开始时最大玩家在筹码中以2结束他的移动,这是有道理的。如果你想将返回值切换为100,你需要更改游戏以使最大玩家先行(因为在这个游戏场景中,无论谁先获胜)。

答案 1 :(得分:0)

我解决了我的问题。我需要将value = min(value,minimax(x))更改为value = max(value,minimax(x))和250到-250。问题解决了。