scipy稀疏诊断矩阵构造中的错误

时间:2015-11-10 04:54:00

标签: python scipy sparse-matrix

当使用scipy.sparse.spdiags或scipy.sparse.diags时,我注意到我希望我认为这是例程中的错误,例如

scipy.sparse.spdiags([1.1,1.2,1.3],1,4,4).toarray()

返回

array([[ 0. ,  1.2,  0. ,  0. ],
       [ 0. ,  0. ,  1.3,  0. ],
       [ 0. ,  0. ,  0. ,  0. ],
       [ 0. ,  0. ,  0. ,  0. ]])

对于正对角线,它会丢弃前k个数据。有人可能会说,这有一些宏大的编程原因,我只需要用零填充。好吧很烦人,可以使用scipy.sparse.diags来提供正确的结果。但是,这个例程有一个无法解决的错误

scipy.sparse.diags([1.1,1.2],0,(4,2)).toarray()

给出

array([[ 1.1,  0. ],
       [ 0. ,  1.2],
       [ 0. ,  0. ],
       [ 0. ,  0. ]])

很好,

scipy.sparse.diags([1.1,1.2],-2,(4,2)).toarray()

给出

array([[ 0. ,  0. ],
       [ 0. ,  0. ],
       [ 1.1,  0. ],
       [ 0. ,  1.2]])

scipy.sparse.diags([1.1,1.2],-1,(4,2)).toarray()

给出一个错误,指出ValueError:对角线长度(偏移-1处的索引0:2)与矩阵大小(4,2)不一致。显然答案是

array([[ 0. ,  0. ],
       [ 1.1,  0. ],
       [ 0. ,  1.2],
       [ 0. ,  0. ]])

我们有额外的随机行为

scipy.sparse.diags([1.1],-1,(4,2)).toarray()

给予

array([[ 0. ,  0. ],
       [ 1.1,  0. ],
       [ 0. ,  1.1],
       [ 0. ,  0. ]])

任何人都知道是否有构造实际有效的对角稀疏矩阵的函数?

1 个答案:

答案 0 :(得分:2)

执行摘要:spdiags正常工作,即使矩阵输入不是最直观的。 diags有一个影响矩形矩阵中某些偏移的错误。 scipy github上有一个bug修复。

spdiags的示例是:

>>> data = array([[1,2,3,4],[1,2,3,4],[1,2,3,4]])
>>> diags = array([0,-1,2])
>>> spdiags(data, diags, 4, 4).todense()
matrix([[1, 0, 3, 0],
        [1, 2, 0, 4],
        [0, 2, 3, 0],
        [0, 0, 3, 4]])

请注意,data的第3列始终显示在稀疏的第3列中。其他列也排成一列。但是,如果它们“脱离边缘”,它们就被省略了。

此函数的输入是一个矩阵,而diags的输入是一个参差不齐的列表。稀疏矩阵的对角线都具有不同数量的值。因此规范必须在一个或另一个中容纳这个。 spdiags通过列表输入忽略某些值diags来实现此目的。

sparse.diags([1.1,1.2],-1,(4,2))错误令人费解。

spdiags等价物确实有效:

In [421]: sparse.spdiags([[1.1,1.2]],-1,4,2).A
Out[421]: 
array([[ 0. ,  0. ],
       [ 1.1,  0. ],
       [ 0. ,  1.2],
       [ 0. ,  0. ]])

此代码块中出现错误:

for j, diagonal in enumerate(diagonals):
    offset = offsets[j]
    k = max(0, offset)
    length = min(m + offset, n - offset)
    if length <= 0:
        raise ValueError("Offset %d (index %d) out of bounds" % (offset, j))
    try:
        data_arr[j, k:k+length] = diagonal
    except ValueError:
        if len(diagonal) != length and len(diagonal) != 1:
            raise ValueError(
                "Diagonal length (index %d: %d at offset %d) does not "
                "agree with matrix size (%d, %d)." % (
                j, len(diagonal), offset, m, n))
        raise

diags中的实际矩阵构造函数是:

dia_matrix((data_arr, offsets), shape=(m, n))

这与spdiags使用的构造函数相同,但没有任何操作。

In [434]: sparse.dia_matrix(([[1.1,1.2]],-1),shape=(4,2)).A
Out[434]: 
array([[ 0. ,  0. ],
       [ 1.1,  0. ],
       [ 0. ,  1.2],
       [ 0. ,  0. ]])

dia格式中,输入完全按spdiags给出的方式存储(带有额外值的矩阵):

In [436]: M.data
Out[436]: array([[ 1.1,  1.2]])
In [437]: M.offsets
Out[437]: array([-1], dtype=int32)

正如@user2357112指出的那样,length = min(m + offset, n - offset是错误的,在测试用例中产生3。将其更改为length = min(m + k, n - k)会使此(4,2)矩阵的所有情况都起作用。但是转换失败了:diags([1.1,1.2], 1, (2, 4))

截至10月5日,此问题的更正是:

https://github.com/pv/scipy-work/commit/529cbde47121c8ed87f74fa6445c05d71353eb6c

length = min(m + offset, n - offset, min(m,n))

使用此修复程序,diags([1.1,1.2], 1, (2, 4))有效。