我试图在python中编写一个minimax算法。但它太令人困惑了。我是递归函数的新手。我的思维结构在某个地方有一些错误,但我无法解决它。我的minimax树返回'-100',必须为100才能获得真正的答案。如果遗漏或不清楚,请告诉我。谢谢
def startposition():
return 2, 'max'
def terminalstate(state):
if state == (0, 'min') or state == (0, 'max'):
return True
else:
return False
def minimax(state):
if terminalstate(state):
return utilitystatic(state)
else:
if state[1] == 'min':
value = -250
for x in successorsgenerator(state):
value = max(value, minimax(x))
elif state[1] == 'max':
value = 250
for x in successorsgenerator(state):
value = min(value, minimax(x))
return value
def utilitystatic(state):
assert terminalstate(state)
if state[1] == 'max':
return -100
elif state[1] == 'min':
return 100
assert False
def successorsgenerator(state):
successors = []
state = toggle(state)
newstate = decrease(state)
i = 0
while newstate[0] >= 0 and i < 3:
successors.append(newstate)
i += 1
newstate = decrease(newstate)
print('successors:', successors)
return successors
def toggle(state):
state = list(state)
state[1] = 'min' if state[1] == 'max' else 'max'
state = tuple(state)
return state
def decrease(state):
state = state[:0] + (state[0] - 1,) + state[1:2]
return state
stick = startposition()
exit = minimax(stick)
print('last result', exit)
答案 0 :(得分:1)
如果最小玩家先行,则从最大玩家的角度来看代码是正确的。 minimax的工作方式,min层应该返回所有可能状态的最小值(因为min玩家也在优化他们的移动)。因此,您不应该切换最小和最大呼叫,而应该首先选择哪个播放器。
这是你的状态树可视化:https://imgur.com/a/0iRFc.jpg(我显然没有足够的代表来显示图像)。递归的顶层将采用
max(-250, -100)
并返回-100。因为游戏开始时最大玩家在筹码中以2结束他的移动,这是有道理的。如果你想将返回值切换为100,你需要更改游戏以使最大玩家先行(因为在这个游戏场景中,无论谁先获胜)。
答案 1 :(得分:0)
我解决了我的问题。我需要将value = min(value,minimax(x))更改为value = max(value,minimax(x))和250到-250。问题解决了。