最有效的第N个邻居搜索邻居数据的方法

时间:2013-10-31 14:23:26

标签: python performance list list-comprehension

问题

我的程序生成了几组数据,使我能够在tkinter画布上使用它们的连接渲染顶点网络。我需要能够找到网络中每个顶点的第N个邻居。
我的代码已经识别出每个顶点与它们的直接邻居的连接,这意味着使用列表推导可以很容易地找到第一组邻居,使用所选择的顶点作为搜索数据的值。我实际上想要为每个邻居重复这个搜索,但是最有效的方法。为了实现这一目的而搜索到的数据(我已经计算过)在下面的代码中被指定为p_2,其形式为:(原点坐标,邻居坐标)和Coordinates_xyz是网络的唯一顶点列表。下面的代码演示了我目前如何识别第一个邻居。

同样,我已经有了所有的邻居数据,我只需要最好的方法来搜索这些数据,找到每个顶点的连接。

净度:

我正在尝试做的例子:
我的程序生成的一种数据表示重复方形图案中的顶点网络。每个顶点(远离边缘)有4个邻居,然后每个邻居有4个邻居(尽管这些邻居的一个邻居是前一个顶点因此被打折),依此类推。 如果我选择坐标为(x20, y20, z20)的顶点20并在p_2中搜索邻居,它可能会返回(例如):
(原产地),(邻居)
(x20, y20, z20), (x21, y21, z21)
(x23, y23, z23), (x20, y20, z20)
(x26, y26, z23), (x20, y20, z20) (x20, y20, z20), (x30, y30, z30)
然后我可以清楚地看到顶点21,23,26和30是网络中到顶点20的相邻点。但是,我需要分别重复搜索过程21,23,26和30以找到第二个最近邻居。对于N个最近邻居,我必须找到一种方法来制作一种有效(尽可能)的方法,用于重复对每个邻居的搜索并从顶点20向外进行,同时跟踪邻居的顺序。同样,我知道这对于大N来说会很费力,但它通常不会在N> 4时运行。 下面的代码解决了N = 1的问题。

matching_1_NN_list=[]
matching_1_NN_list[:]=[]    
for vertex in xrange(len(Coordinates_xyz)):
    #Target vertex Coordinates_xyz[vertex] 
    matching_1_NN = [x for x in p_2 if Coordinates_xyz[vertex] in x]
    matching_1_NN_Component_0=column(matching_1_NN, 0)
    matching_1_NN_Component_1=column(matching_1_NN, 1)
    for x in matching_1_NN_Component_0:
        if x == Coordinates_xyz_final[vertex]:
            pass
        else:
            x=x, vertex, 1 #coordinates, vertex number, order (1 = first neighbour)
            matching_1_NN_list.append(x)


    for x in matching_1_NN_Component_1:
        if x == Coordinates_xyz_final[vertex]:
            pass
        else:
            x=x, vertex, 1
            matching_1_NN_list.append(x)
    matching_1_NN_list=set(list(matching_1_NN_list)) #Removes Duplicates

1 个答案:

答案 0 :(得分:1)

在优化这一点方面似乎很大一部分正在改进搜索邻居的方式。在您当前的方法中,您遍历整个对列表,并在每次您需要查找顶点的邻居时执行的成员资格检查。更好的方法是只执行一次此步骤,并在字典中查找结果。例如,如果您有以下顶点:

 7 |  E
 6 |
 5 |
 4 |  D
 3 |
 2 |     B  C
 1 |  A
 0 +----------
   0  1  2  3

使用以下最近邻居列表:

p_2 = [('A', 'B'),
       ('B', 'C'),
       ('C', 'B'),
       ('D', 'B'),
       ('E', 'D')]

你可以这样做:

from collections import defaultdict

p_2_dict = defaultdict(set)
for a, b in p_2:
    p_2_dict[a].add(b)
    p_2_dict[b].add(a)

def find_neigbours(start_vertex, levels):
    found = []
    from_vertices = [start_vertex]
    for i in range(1, levels+1):
        new_from_vertices = []
        for vertex in from_vertices:
            for neighbour in p_2_dict[vertex]:
                new_from_vertices.append(neighbour)
                found.append( (neighbour, i) )
        from_vertices = new_from_vertices
    return found
然而,这会发现很多重复。就像在示例代码中所做的那样,您可以使用集合来仅存储唯一值。此外,如果您遇到起始顶点,则可以跳过它。

def find_neigbours(start_vertex, levels):
    found = set()
    from_vertices = [start_vertex]
    for i in range(1, levels+1):
        new_from_vertices = set()
        for vertex in from_vertices:
            for neighbour in p_2_dict[vertex]:
                if neighbour == start_vertex:
                    continue
                new_from_vertices.add(neighbour)
                found.add( (neighbour, i) )
        from_vertices = new_from_vertices
    return found

但是,如果与其关联的“邻居的顺序”与已存储的不同,则存储重复的顶点。你想和那些人做什么?只存储第一次遇到特定顶点时的顺序?

输出:

In [49]: find_neigbours('A', 1)
Out[49]: set([('B', 1)])

In [50]: find_neigbours('A', 2)
Out[50]: set([('B', 1), ('D', 2), ('C', 2)])

# 'B' encountered with different order:
In [51]: find_neigbours('A', 3)
Out[51]: set([('B', 1), ('D', 2), ('B', 3), ('E', 3), ('C', 2)])