如何有效地重塑和scipy.sparse csr_matrix?
我需要在末尾添加零行。 使用:
from scipy.sparse import csr_matrix
data = [1,2,3,4,5,6]
col = [0,0,0,1,1,1]
row = [0,1,2,0,1,2]
a = csr_matrix((data, (row, col)))
a.reshape(3,5)
我收到此错误:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/local/lib/python3.5/dist-packages/scipy/sparse/base.py", line 129, in reshape
self.__class__.__name__)
NotImplementedError: Reshaping not implemented for csr_matrix.
答案 0 :(得分:2)
reshape()
方法将与scipy 1.1中的csr_matrix
个对象一起使用,该方法即将发布。在此期间,您可以尝试Reshape sparse matrix efficiently, Python, SciPy 0.12处的代码来重塑稀疏矩阵。
但是,您的示例将不起作用,因为您正在尝试将具有形状(3,2)的数组重新整形为具有形状(3,5)的数组。链接到上面的代码和稀疏reshape()
方法遵循与numpy数组的reshape()
方法相同的规则:您无法更改数组的总大小。
如果你想改变总大小,你最终将能够使用resize()
方法(就地操作),但这也是scipy 1.1的新功能,所以它还没有释放。
相反,您可以构建一个新的稀疏矩阵,如下所示:
In [57]: b = csr_matrix((a.data, a.indices, a.indptr), shape=(3, 5))
In [58]: b.shape
Out[58]: (3, 5)
In [59]: b.A
Out[59]:
array([[1, 4, 0, 0, 0],
[2, 5, 0, 0, 0],
[3, 6, 0, 0, 0]], dtype=int64)
答案 1 :(得分:2)
如果您能及早发现问题,只需添加一个形状参数:
In [48]: a = csr_matrix((data, (row, col)))
In [49]: a
Out[49]:
<3x2 sparse matrix of type '<class 'numpy.int64'>'
with 6 stored elements in Compressed Sparse Row format>
In [50]: a = csr_matrix((data, (row, col)),shape=(3,5))
In [51]: a
Out[51]:
<3x5 sparse matrix of type '<class 'numpy.int64'>'
with 6 stored elements in Compressed Sparse Row format>
In [52]: a.A
Out[52]:
array([[1, 4, 0, 0, 0],
[2, 5, 0, 0, 0],
[3, 6, 0, 0, 0]], dtype=int64)
你也可以在垫上hstack
。确保它是稀疏版本:
In [59]: z = sparse.coo_matrix(np.zeros((3,3)))
In [60]: z
Out[60]:
<3x3 sparse matrix of type '<class 'numpy.float64'>'
with 0 stored elements in COOrdinate format>
In [61]: sparse.hstack((a,z))
Out[61]:
<3x5 sparse matrix of type '<class 'numpy.float64'>'
with 6 stored elements in COOrdinate format>
In [62]: _.A
Out[62]:
array([[1., 4., 0., 0., 0.],
[2., 5., 0., 0., 0.],
[3., 6., 0., 0., 0.]])
hstack
使用sparse.bmat
。它结合了2个数组的coo
属性,并创建了一个新的coo
矩阵。