numpy / scipy从加权边缘列表构建邻接矩阵

时间:2015-03-19 14:13:31

标签: python numpy scipy

我正在阅读加权的egdelist / numpy数组,如:

0 1 1
0 2 1
1 2 1
1 0 1
2 1 4

其中列是'用户1','用户2','权重'。我想用scipy.sparse.csgraph.depth_first_tree执行DFS算法,这需要N×N矩阵作为输入。如何将以前的列表转换为方形矩阵:

0 1 1
1 0 1
0 4 0

在numpy或scipy内?

感谢您的帮助。

编辑:

我一直在与一个巨大的(1.5亿个节点)网络合作,所以我正在寻找一种内存有效的方法来实现这一目标。

2 个答案:

答案 0 :(得分:4)

您可以使用内存效率scipy.sparse matrix

import numpy as np
import scipy.sparse as sparse

arr = np.array([[0, 1, 1],
                [0, 2, 1],
                [1, 2, 1],
                [1, 0, 1],
                [2, 1, 4]])
shape = tuple(arr.max(axis=0)[:2]+1)
coo = sparse.coo_matrix((arr[:, 2], (arr[:, 0], arr[:, 1])), shape=shape,
                        dtype=arr.dtype)

print(repr(coo))
# <3x3 sparse matrix of type '<type 'numpy.int64'>'
#   with 5 stored elements in COOrdinate format>

要将稀疏矩阵转换为密集的numpy数组,可以使用todense

print(coo.todense())
# [[0 1 1]
#  [1 0 1]
#  [0 4 0]]

答案 1 :(得分:1)

尝试以下内容:

import numpy as np
import scipy.sparse as sps

A = np.array([[0, 1, 1],[0, 2, 1],[1, 2, 1],[1, 0, 1],[2, 1, 4]])
i, j, weight = A[:,0], A[:,1], A[:,2]
# find the dimension of the square matrix
dim =  max(len(set(i)), len(set(j)))

B = sps.lil_matrix((dim, dim))
for i,j,w in zip(i,j,weight):
    B[i,j] = w

print B.todense()
>>>
[[ 0.  1.  1.]
 [ 1.  0.  1.]
 [ 0.  4.  0.]]