我的GMRES实施有什么问题?

时间:2016-06-22 08:14:31

标签: python numpy scipy numerical-methods jupyter-notebook

我试图在Jupyter笔记本中实现GMRES,这是(如果你不知道):

enter image description here

这是我的代码:

import numpy as np

def GMRes(A, b, x0, e, nmax_iter, restart=None):
    r = b - np.asarray(np.dot(A, x0)).reshape(-1)

    x = []
    q = [0] * (nmax_iter)

    x.append(r)

    q[0] = r / np.linalg.norm(r)

    h = np.zeros((nmax_iter + 1, nmax_iter))

    for k in range(nmax_iter):
        y = np.asarray(np.dot(A, q[k])).reshape(-1)

        for j in range(k):
            h[j, k] = np.dot(q[j], y)
            y = y - h[j, k] * q[j]
        h[k + 1, k] = np.linalg.norm(y)
        if (h[k + 1, k] != 0 and k != nmax_iter - 1):
            q[k + 1] = y / h[k + 1, k]

        b = np.zeros(nmax_iter + 1)
        b[0] = np.linalg.norm(r)

        result = np.linalg.lstsq(h, b)[0]

        x.append(np.dot(np.asarray(q).transpose(), result) + x0)

    return x

据我说它应该是正确的,但是当我执行时:

A = np.matrix('1 1; 3 -4')
b = np.array([3, 2])
x0 = np.array([1, 2])

e = 0
nmax_iter = 5

x = GMRes(A, b, x0, e, nmax_iter)

print(x)

注意:现在e什么也没做。

我明白了:

[array([0, 7]), array([ 1.,  2.]), array([ 1.35945946,  0.56216216]), array([ 1.73194463,  0.80759216]), array([ 2.01712479,  0.96133459]), array([ 2.01621042,  0.95180204])]

x[k]应该接近(32/7, -11/7),因为这是结果,但是接近(2, 1),我做错了什么?

2 个答案:

答案 0 :(得分:6)

我认为算法给出了正确的结果。

您正在尝试解决Ax = b,其中:

A = \begin{bmatrix} 1 & 1 \  3 & -4 \end{bmatrix}, b = \begin{bmatrix} 3 \  2 \end{bmatrix}

如果您尝试手动找到解决方案,您尝试解决的矩阵操作等同于可以使用替换解决的系统。

\begin{cases} x_1 + x_2 = 3 \ 3x_1-4x_2 = 2\end{cases}

如果你试图解决它,你会发现解决方案是:

x_1=2,x_2=1

您的算法提供的解决方案与此相同。

您可以使用scipy中的GMRES实现来仔细检查:

import scipy.sparse.linalg as spla
import numpy as np

A = np.matrix('1 1; 3 -4')
b = np.array([3, 2])
x0 = np.array([1, 2])
spla.gmres(A,b,x0)

哪个输出

array([ 2.,  1.])

答案 1 :(得分:2)

请注意,此算法会收敛到正确的结果,但执行速度太慢。要收敛的GMRES迭代的最大数量不应超过矩阵A的维数。如果矩阵A的维数是n,则第(n + 1)个第Arnoldi向量应该为零,例如,我们应该能够用n个Arnoldi向量完全跨越Krylov空间。我只是应用以下补丁,事情应该按照它们的原样运行:

-    for k in range(nmax_iter):
+    for k in range(min(nmax_iter, A.shape[0])):
         y = np.asarray(np.dot(A, q[k])).reshape(-1)

-        for j in range(k):
+        for j in range(k + 1):

解决方案矢量序列应该只是:

 [array([ 1.        ,  0.35294118]), array([ 2.,  1.])]

e.g。我们在两次迭代中收敛,我们期望,因为n = 2。