我有一个无向网络,其中每个节点可以是 k 类型之一。对于每个节点 i ,我需要计算节点 i 对每种类型的邻居数。
现在我用边缘列表表示边缘,其中列是节点的索引。节点表示为 n x k 矩阵,其中每列表示节点类型。如果节点的类型为 k ,则 k 列的值为1,0,否则为
。这是我当前的代码,这是正确的,但速度太慢。
# example nodes and edges, both typically much longer
nodes = np.array([[0, 0, 1],
[0, 1, 0],
[1, 0, 0]])
edges = np.array([[0, 1],
[1, 2]])
neighbors = np.zeros_like(nodes)
for i, j in edges:
neighbors[i] += nodes[j]
neighbors[j] += nodes[i]
是否有一些聪明的numpy可以让我避免这种循环?如果最好的方法是使用邻接矩阵,那也是可以接受的。
答案 0 :(得分:2)
如果我理解你的问题,numpy_indexed包(免责声明:我是它的作者)有一个快速而优雅的解决方案:
# generate a random example graph
n_edges = 50
n_nodes = 10
n_types = 3
edges = np.random.randint(0, n_nodes, size=(n_edges, 2))
node_types = np.random.randint(0, 2, size=(n_nodes, n_types)).astype(np.bool)
# Note; this is for a directed graph
s, e = edges.T
# for undirected, add reversed edges
s, e = np.concatenate([edges, edges[:,::-1]], axis=0).T
import numpy_indexed as npi
node_idx, neighbor_type_count = npi.group_by(s).sum(node_types[e])
通常,图形操作或涉及锯齿状数组的算法通常可以使用分组操作高效,优雅地表达。
答案 1 :(得分:1)
您只需使用np.add.at
-
out = np.zeros_like(nodes)
np.add.at(out, edges[:,0],nodes[edges[:,1]])
np.add.at(out, edges[:,1],nodes[edges[:,0]])