我正在试图弄清楚如何按列遍历scipy稀疏矩阵。我正在尝试计算每列的总和,然后用该总和对该列的成员进行加权。我想要做的基本上是:
for i=0 to #columns
for j=0 to #rows
sum=sum+matrix[i,j]
for j=0to #rows
matrix[i,j]=matrix[i,j]/sum
我在示例中看到的所有迭代器都会立即迭代整个矩阵,而不是按列进行迭代。有办法做我想做的事吗?
答案 0 :(得分:3)
Scipy稀疏矩阵有自己的sum
方法可用于此。例如:
A=sp.lil_matrix((5,5))
b=1+np.arange(0,5)
A.setdiag(b[:-1],k=1)
A.setdiag(b)
print(A)
(0, 0) 1.0
(0, 1) 1.0
(1, 1) 2.0
(1, 2) 2.0
(2, 2) 3.0
(2, 3) 3.0
(3, 3) 4.0
(3, 4) 4.0
(4, 4) 5.0
f=A.sum(axis=0)
print(f)
[[1. 3. 5. 7. 9.]]
返回的总和是密集的numpy.matrix
,您可以将其转换为缩放因子:
print(A/f)
[[1. 0.33333333 0. 0. 0. ]
[0. 0.66666667 0.4 0. 0. ]
[0. 0. 0.6 0.42857143 0. ]
[0. 0. 0. 0.57142857 0.44444444]
[0. 0. 0. 0. 0.55555556]]