按列迭代scipy稀疏矩阵

时间:2012-05-07 00:32:13

标签: python numpy scipy sparse-matrix

我正在试图弄清楚如何按列遍历scipy稀疏矩阵。我正在尝试计算每列的总和,然后用该总和对该列的成员进行加权。我想要做的基本上是:

for i=0 to #columns
  for j=0 to #rows
    sum=sum+matrix[i,j]
  for j=0to #rows
    matrix[i,j]=matrix[i,j]/sum

我在示例中看到的所有迭代器都会立即迭代整个矩阵,而不是按列进行迭代。有办法做我想做的事吗?

1 个答案:

答案 0 :(得分:3)

Scipy稀疏矩阵有自己的sum方法可用于此。例如:

A=sp.lil_matrix((5,5))
b=1+np.arange(0,5)
A.setdiag(b[:-1],k=1)
A.setdiag(b)


print(A)
  (0, 0)        1.0
  (0, 1)        1.0
  (1, 1)        2.0
  (1, 2)        2.0
  (2, 2)        3.0
  (2, 3)        3.0
  (3, 3)        4.0
  (3, 4)        4.0
  (4, 4)        5.0

f=A.sum(axis=0)

print(f)   
[[1. 3. 5. 7. 9.]]

返回的总和是密集的numpy.matrix,您可以将其转换为缩放因子:

print(A/f)
[[1.         0.33333333 0.         0.         0.        ]
 [0.         0.66666667 0.4        0.         0.        ]
 [0.         0.         0.6        0.42857143 0.        ]
 [0.         0.         0.         0.57142857 0.44444444]
 [0.         0.         0.         0.         0.55555556]]