Heapq模块和字典之间存在奇怪的干扰

时间:2019-03-26 16:41:48

标签: python python-2.7 dictionary heapq

一方面,我有一个grid defaultdict,它存储网格中每个节点的相邻节点及其权重(在下面的示例中为1)。

        node   (w  nbr_node)
grid = { 0:   [(1, -5), (1, -4), (1, -3), (1, -1), (1, 1), (1, 3), (1, 4), (1, 5)], 
         1:   [(1, -4), (1, -3), (1, -2), (1, 0), (1, 2), (1, 4), (1, 5), (1, 6)], 
         2:   [(1, -3), (1, -2), (1, -1), (1, 1), (1, 3), (1, 5), (1, 6), (1, 7)], 
         3:   [(1, -2), (1, -1), (1, 0), (1, 2), (1, 4), (1, 6), (1, 7), (1, 8)],
        ...
        }

另一方面,我有一个Djisktra函数,该函数计算此网格上2个节点之间的最短路径。该算法使用heapq模块,效果很好。

import heapq

def Dijkstra(s, e, grid): #startpoint, endpoint, grid
    visited = set()
    distances = {s: 0} 
    p = {} 
    queue = [(0, s)] 

    while queue != []:

        weight, node = heappop(queue) 
        if node in visited: 
            continue

        visited.add(node) 

        for n_weight, n_node in grid[node]: 
            if n_node in visited: 
                continue

            total = weight + n_weight 

            if n_node not in distances or distances[n_node] > total: 

                distances[n_node] = total
                heappush(queue, (total, n_node))
                p[n_node] = node

问题:当多次调用Djikstra函数时,heappush正在...无缘无故地在grid字典中添加新键!

这是MCVE:

from collections import defaultdict

# Creating the dictionnary
grid = defaultdict(list) 
N = 4
kernel = (-N-1, -N, -N+1, -1, 1, N-1, N, N+1)

for i in range(N*N): 
    for n in kernel:
        if i > N and i < (N*N) - 1 - N and (i%N) > 0 and (i%N) < N - 1:
            grid[i].append((1, i+n))



# Calling Djikstra multiple times
keys = [*range(N*N)]

while keys:

    k1, k2 = random.sample(keys, 2)

    Dijkstra(k1, k2, grid) 

    keys.remove(k1)
    keys.remove(k2)

原始grid默认值:

dict_keys([5, 6, 9, 10])

...并且多次调用Djikstra函数后:

dict_keys([5, 6, 9, 10, 4, 0, 1, 2, 8, 3, 7, 11, 12, 13, 14, 15])

多次调用Djikstra函数时没有 heappush(只需在结尾处注释heappush):

dict_keys([5, 6, 9, 10])

问题

  • 如何避免这种奇怪的行为?

请注意,我使用的是Python 2.7,不能使用numpy。

1 个答案:

答案 0 :(得分:1)

我可以复制并修复。问题出在构建grid的方式上:在示例中,它包含的值不在-4到0以及从16到20的键中。因此,您将那些不存在的节点推到头部,然后弹出它们。

然后您将执行for n_weight, n_node in grid[node]:,其中node不(仍然)存在grid。由于grid是默认字典,因此会自动插入一个新列表,并以一个空列表作为值。

修复很简单(至少对于示例数据而言):足以确保作为值添加的所有节点都是网格,并以模为键:

for i in range(N*N): 
    for n in kernel:
        grid[i].append((1, (i+n + N + 1)%(N*N)))

但是即使对于真实数据,要确保存在于网格值中的所有节点也都存在于键中应该不是很困难...

顺便说一句,如果grid是一个简单的dict,则该错误将立即在KeyError上出现grid[node]