Question

我有一个无向网络，其中每个节点可以是 k 类型之一。对于每个节点 i ，我需要计算节点 i 对每种类型的邻居数。

现在我用边缘列表表示边缘，其中列是节点的索引。节点表示为 n x k 矩阵，其中每列表示节点类型。如果节点的类型为 k ，则 k 列的值为1,0，否则为

。

这是我当前的代码，这是正确的，但速度太慢。

# example nodes and edges, both typically much longer
nodes = np.array([[0, 0, 1], 
                  [0, 1, 0],                       
                  [1, 0, 0]])
edges = np.array([[0, 1],
                  [1, 2]])

neighbors = np.zeros_like(nodes)

for i, j in edges:
   neighbors[i] += nodes[j]
   neighbors[j] += nodes[i]

是否有一些聪明的numpy可以让我避免这种循环？如果最好的方法是使用邻接矩阵，那也是可以接受的。

Answer 1

如果我理解你的问题，numpy_indexed包（免责声明：我是它的作者）有一个快速而优雅的解决方案：

# generate a random example graph
n_edges = 50
n_nodes = 10
n_types = 3
edges = np.random.randint(0, n_nodes, size=(n_edges, 2))
node_types = np.random.randint(0, 2, size=(n_nodes, n_types)).astype(np.bool)

# Note; this is for a directed graph
s, e = edges.T
# for undirected, add reversed edges
s, e = np.concatenate([edges, edges[:,::-1]], axis=0).T
import numpy_indexed as npi
node_idx, neighbor_type_count = npi.group_by(s).sum(node_types[e])

通常，图形操作或涉及锯齿状数组的算法通常可以使用分组操作高效，优雅地表达。

Answer 2

您只需使用np.add.at -

即可

out = np.zeros_like(nodes)
np.add.at(out, edges[:,0],nodes[edges[:,1]])
np.add.at(out, edges[:,1],nodes[edges[:,0]])

用numpy从edgelist积累“neigborhood”的值

2 个答案: