如何使用矢量化码解决许多超定线性方程组?

时间:2015-05-25 16:25:31

标签: multidimensional-array scipy vectorization linear-algebra least-squares

我需要求解一个线性方程组Lx = b,其中x总是一个向量(3x1数组),L是Nx3数组,b是Nx1向量。 N通常在4到10之间。我使用

解决这个问题没有问题
  

scipy.linalg.lstsq(L,b)

然而,我需要多次这样做(类似于200x200 = 40000次),因为x实际上与图像中的每个像素相关联。因此,x实际上存储在PxQx3阵列中,其中P和Q类似于200-300,最后一个数字“3”指向量x。现在我只是循环遍历每一列和一行并逐个求解方程式。如何有效地解决那些40000个不同的超线性线性方程组,可能使用了一些矢量化技术或其他特殊方法?

感谢

1 个答案:

答案 0 :(得分:6)

通过使用numpy.linalg例程的stack of matrices功能,您可以获得一些速度。这对numpy.linalg.lstsq还不起作用,但是numpy.linalg.svd会这样做,所以你可以自己实现lstsq:

import numpy as np


def stacked_lstsq(L, b, rcond=1e-10):
    """
    Solve L x = b, via SVD least squares cutting of small singular values
    L is an array of shape (..., M, N) and b of shape (..., M).
    Returns x of shape (..., N)
    """
    u, s, v = np.linalg.svd(L, full_matrices=False)
    s_max = s.max(axis=-1, keepdims=True)
    s_min = rcond*s_max
    inv_s = np.zeros_like(s)
    inv_s[s >= s_min] = 1/s[s>=s_min]
    x = np.einsum('...ji,...j->...i', v,
                  inv_s * np.einsum('...ji,...j->...i', u, b.conj()))
    return np.conj(x, x)


def slow_lstsq(L, b):
    return np.array([np.linalg.lstsq(L[k], b[k])[0]
                     for k in range(L.shape[0])])    


def test_it():
    b = np.random.rand(1234, 3)
    L = np.random.rand(1234, 3, 6)

    x = stacked_lstsq(L, b)
    x2 = slow_lstsq(L, b)

    # Check
    print(x.shape, x2.shape)
    diff = abs(x - x2).max()
    print("difference: ", diff)
    assert diff < 1e-13


test_it()

某些时间表明堆叠版本的速度提高了约6倍, 对于那个问题的大小。是否值得麻烦取决于 问题。