SciPy / NumPy:规范化csr_matrix

时间:2012-12-04 14:43:44

标签: python numpy scipy

我正在尝试规范化csr_matrix:

<5400x6845 sparse matrix of type '<type 'numpy.float64'> with 91833 stored elements in Compressed Sparse Row format>

我试过的是:

import numpy as np
from scipy import sparse

# ve is my csr_matrix
ve_sum = ve.sum(axis=1)
ve_sums = sparse.csr_matrix(np.tile(ve_sum, (1, ve.shape[1]))) # <-- here I get MemoryError
n_ve = ve/ve_sums 

这显然不是进行这种简单规范化的正确方法。

正确的方法是什么?

1 个答案:

答案 0 :(得分:3)

# Normalize the rows of ve.
row_sums = np.array(ve.sum(axis=1))[:,0]
row_indices, col_indices = ve.nonzero()
ve.data /= row_sums[row_indices]

快速谷歌搜索也会发现这一点。