用numpy从edgelist积累“neigborhood”的值

时间:2016-09-30 21:16:18

标签: python numpy vectorization graph-algorithm numpy-broadcasting

我有一个无向网络,其中每个节点可以是 k 类型之一。对于每个节点 i ,我需要计算节点 i 对每种类型的邻居数。

现在我用边缘列表表示边缘,其中列是节点的索引。节点表示为 n x k 矩阵,其中每列表示节点类型。如果节点的类型为 k ,则 k 列的值为1,0,否则为

这是我当前的代码,这是正确的,但速度太慢。

# example nodes and edges, both typically much longer
nodes = np.array([[0, 0, 1], 
                  [0, 1, 0],                       
                  [1, 0, 0]])
edges = np.array([[0, 1],
                  [1, 2]])

neighbors = np.zeros_like(nodes)

for i, j in edges:
   neighbors[i] += nodes[j]
   neighbors[j] += nodes[i]

是否有一些聪明的numpy可以让我避免这种循环?如果最好的方法是使用邻接矩阵,那也是可以接受的。

2 个答案:

答案 0 :(得分:2)

如果我理解你的问题,numpy_indexed包(免责声明:我是它的作者)有一个快速而优雅的解决方案:

# generate a random example graph
n_edges = 50
n_nodes = 10
n_types = 3
edges = np.random.randint(0, n_nodes, size=(n_edges, 2))
node_types = np.random.randint(0, 2, size=(n_nodes, n_types)).astype(np.bool)

# Note; this is for a directed graph
s, e = edges.T
# for undirected, add reversed edges
s, e = np.concatenate([edges, edges[:,::-1]], axis=0).T
import numpy_indexed as npi
node_idx, neighbor_type_count = npi.group_by(s).sum(node_types[e])

通常,图形操作或涉及锯齿状数组的算法通常可以使用分组操作高效,优雅地表达。

答案 1 :(得分:1)

您只需使用np.add.at -

即可
out = np.zeros_like(nodes)
np.add.at(out, edges[:,0],nodes[edges[:,1]])
np.add.at(out, edges[:,1],nodes[edges[:,0]])