检索SciPy稀疏矩阵消耗的字节数

时间:2017-01-24 21:27:12

标签: python scipy

假设我想监视我的SciPy稀疏矩阵mat占用的内存。在NumPy中,我会利用nbytes属性,但在SciPy中似乎没有这样的东西。 如何检索此信息?

1 个答案:

答案 0 :(得分:2)

我有稀疏矩阵X

In [605]: X
Out[605]: 
<100x100 sparse matrix of type '<class 'numpy.float64'>'
    with 1000 stored elements in Compressed Sparse Row format>

getsizeof并没有告诉我任何有用的信息

In [606]: import sys
In [607]: sys.getsizeof(X)
Out[607]: 28

对于存储在3个数组中的csr矩阵,稀疏数据和索引是

In [612]: X.data.nbytes
Out[612]: 8000
In [613]: X.indices.nbytes
Out[613]: 4000
In [614]: X.indptr.nbytes
Out[614]: 404

因此,总空间大致是这些值的总和。

coo格式

In [615]: Xc=X.tocoo()
In [616]: Xc.data.nbytes
Out[616]: 8000
In [617]: Xc.row.nbytes
Out[617]: 4000
In [618]: Xc.col.nbytes
Out[618]: 4000

我们可以从shape,dtype和nnz中计算出这些值;例如8字节* 1000,4字节* 1000,4字节* X.shape [0]等

其他格式需要了解其数据存储方法(例如lildok等)。