我希望V_old在j_now完成循环后获取V的值。 但是,V_old在每次j_now迭代后直接接受V的值,因此我得到错误的值,因为新的V_old值始终是新最大值的一部分,依此类推。
for i_iter in range(0,5):
for j_now in range(0, 400):
V[j_now] = np.max(matrix_M[:,j_now] + beta * V_old)
V_old = V
如果某人会很棒。可以帮助我!干杯,托比亚斯