在scipy中对两个稀疏矩阵进行张量积运算后,如何消除零?

时间:2019-01-30 02:15:47

标签: python scipy

我想在scipy中做两个稀疏矩阵的张量积。我使用以下代码

sig1 = csc_matrix(np.array([[0, 1],[1, 0]]))
sig2 = csc_matrix(np.array([[0 , -1],[1 , 0]]))
print(sparse.kron(sig1, sig2))

但是,我得到以下结果

(2, 0) 0 (3, 0) 1 (2, 1) -1 (3, 1) 0 (0, 2) 0 (1, 2) 1 (0, 3) -1 (1, 3) 0
这意味着稀疏矩阵也为(2,0)(3,1)(0,2)(1,3)条目分配内存,即使这些条目也全为零。这绝对是浪费内存,尤其是在我多次执行张量积之后。有没有办法避免计算的麻烦或在计算后消除这些条目?非常感谢你!

1 个答案:

答案 0 :(得分:0)

In [142]: sig1 = sparse.csc_matrix(np.array([[0, 1],[1, 0]]))
     ...: sig2 = sparse.csc_matrix(np.array([[0 , -1],[1 , 0]]))

我们看到0,因为返回格式为Block Sparse Row:

In [143]: M=sparse.kron(sig1,sig2)
In [144]: M
Out[144]: 
<4x4 sparse matrix of type '<class 'numpy.int64'>'
    with 8 stored elements (blocksize = 2x2) in Block Sparse Row format>
In [145]: M.A
Out[145]: 
array([[ 0,  0,  0, -1],
       [ 0,  0,  1,  0],
       [ 0, -1,  0,  0],
       [ 1,  0,  0,  0]], dtype=int64)

如果指定其他格式,则看不到0:

In [146]: M=sparse.kron(sig1,sig2, format='csc')
In [147]: M
Out[147]: 
<4x4 sparse matrix of type '<class 'numpy.int64'>'
    with 4 stored elements in Compressed Sparse Column format>
In [148]: M.A
Out[148]: 
array([[ 0,  0,  0, -1],
       [ 0,  0,  1,  0],
       [ 0, -1,  0,  0],
       [ 1,  0,  0,  0]], dtype=int64)

kron代码表示它使用BSR,因为sig2相对密集。 BSR版本的属性为:

In [150]: M=sparse.kron(sig1,sig2)
In [151]: M.indptr
Out[151]: array([0, 1, 2], dtype=int32)
In [152]: M.indices
Out[152]: array([1, 0], dtype=int32)
In [153]: M.data
Out[153]: 
array([[[ 0, -1],
        [ 1,  0]],

       [[ 0, -1],
        [ 1,  0]]], dtype=int64)

等效于csr的属性:

In [158]: M1=sparse.kron(sig1,sig2, 'csr')
In [159]: M1.indptr
Out[159]: array([0, 1, 2, 3, 4], dtype=int32)
In [160]: M1.indices
Out[160]: array([3, 2, 1, 0], dtype=int32)
In [161]: M1.data
Out[161]: array([-1,  1, -1,  1], dtype=int64)

data较小,但是indicesindptr较大。如果矩阵大得多,差异可能会更明显。