我在Python中实现了一些基本的线性方程求解器。
我目前已经实现了三角形方程组的前向和后向替换(因此非常简单易于解决!),但即使使用大约50个方程(50x50系数矩阵)的系统,解的精度也变得非常差。
以下代码执行向前/向后替换:
FORWARD_SUBSTITUTION = 1
BACKWARD_SUBSTITUTION = 2
def solve_triang_subst(A: np.ndarray, b: np.ndarray,
substitution=FORWARD_SUBSTITUTION) -> np.ndarray:
"""Solves a triangular system via
forward or backward substitution.
A must be triangular. FORWARD_SUBSTITUTION means A should be
lower-triangular, BACKWARD_SUBSTITUTION means A should be upper-triangular.
"""
rows = len(A)
x = np.zeros(rows, dtype=A.dtype)
row_sequence = reversed(range(rows)) if substitution == BACKWARD_SUBSTITUTION else range(rows)
for row in row_sequence:
delta = b[row] - np.dot(A[row], x)
cur_x = delta / A[row][row]
x[row] = cur_x
return x
我正在使用numpy
和64位浮点数。
我已经设置了一个简单的测试套件,可以生成系数矩阵和x
向量,计算b
,然后使用向前或向后替换来恢复x
,并将其与其已知的有效性值。
以下代码执行以下检查:
import numpy as np
import scipy.linalg as sp_la
RANDOM_SEED = 1984
np.random.seed(RANDOM_SEED)
def check(sol: np.ndarray, x_gt: np.ndarray, description: str) -> None:
if not np.allclose(sol, x_gt, rtol=0.1):
print("Found inaccurate solution:")
print(sol)
print("Ground truth (not achieved...):")
print(x_gt)
raise ValueError("{} did not work!".format(description))
def fuzz_test_solving():
N_ITERATIONS = 100
refine_result = True
for mode in [FORWARD_SUBSTITUTION, BACKWARD_SUBSTITUTION]:
print("Starting mode {}".format(mode))
for iteration in range(N_ITERATIONS):
N = np.random.randint(3, 50)
A = np.random.uniform(0.0, 1.0, [N, N]).astype(np.float64)
if mode == BACKWARD_SUBSTITUTION:
A = np.triu(A)
elif mode == FORWARD_SUBSTITUTION:
A = np.tril(A)
else:
raise ValueError()
x_gt = np.random.uniform(0.0, 1.0, N).astype(np.float64)
b = np.dot(A, x_gt)
x_est = solve_triang_subst(A, b, substitution=mode,
refine_result=refine_result)
# TODO report error and count, don't throw!
# Keep track of error norm!!
check(x_est, x_gt,
"Mode {} custom triang iteration {}".format(mode, iteration))
if __name__ == '__main__':
fuzz_test_solving()
请注意,测试矩阵的最大大小为49x49。即使在这种情况下,系统也不能总是计算出合适的解决方案,并且失败的幅度超过0.1。这是一个这样的失败的例子(这是后向替换,所以最大的误差在第0个系数;所有测试数据均匀地从[0,1 []中采样:
Solution found with Mode 2 custom triang iteration 24:
[ 0.27876067 0.55200497 0.49499509 0.3259397 0.62420183 0.47041149
0.63557676 0.41155446 0.47191956 0.74385864 0.03002819 0.4700286
0.37989592 0.56527691 0.15072607 0.05659282 0.52587574 0.82252197
0.65662833 0.50250729 0.74139748 0.10852731 0.27864265 0.42981232
0.16327331 0.74097937 0.24411709 0.96934199 0.890266 0.9183985
0.14842446 0.51806495 0.36966843 0.18227989 0.85399593 0.89615663
0.39819336 0.90445931 0.21430972 0.61212349 0.85205597 0.66758689
0.1793689 0.38067267 0.39104614 0.6765885 0.4118123 ]
Ground truth (not achieved...)
[ 0.20881608 0.71009766 0.44735271 0.31169033 0.63982328 0.49075813
0.59669585 0.43844108 0.47764942 0.72222069 0.03497499 0.4707452
0.37679884 0.56439738 0.15120397 0.05635977 0.52616387 0.82230625
0.65670245 0.50251426 0.74139956 0.10845974 0.27864289 0.42981226
0.1632732 0.74097939 0.24411707 0.96934199 0.89026601 0.91839849
0.14842446 0.51806495 0.36966843 0.18227989 0.85399593 0.89615663
0.39819336 0.90445931 0.21430972 0.61212349 0.85205597 0.66758689
0.1793689 0.38067267 0.39104614 0.6765885 0.4118123 ]
我还实现了[0]第2.5节中描述的迭代细化方法,虽然它确实有所帮助,但对于较大的矩阵,结果仍然很差。
我也在MATLAB中进行了这个实验,即使在那里,一旦有超过100个方程,估计误差会呈指数级增长。
以下是我用于此实验的MATLAB代码:
err_norms = [];
range = 1:3:120;
for size=range
A = rand(size, size);
A = tril(A);
x_gt = rand(size, 1);
b = A * x_gt;
x_sol = A\b;
err_norms = [err_norms, norm(x_gt - x_sol)];
end
plot(range, err_norms);
set(gca, 'YScale', 'log')
这是由此产生的情节:
我的问题是:这是正常的行为吗,看到问题基本上没有结构,因为我随机生成A矩阵和x?
如何为各种实际应用求解100个方程的线性系统?这些限制是否仅仅是一个公认的事实,例如,优化算法对这些问题自然是强大的?或者我错过了这个问题的一些重要方面?
[0]:按,William H. Numerical recipes第3版:科学计算的艺术。剑桥大学出版社,2007年。
答案 0 :(得分:2)
没有限制。这是一项非常富有成果的活动,我们都认识到了这一点。编写线性求解器并不是那么容易,这就是为什么几乎总是LAPACK或其他语言中的堂兄弟充满信心地使用它们的原因。
你被几乎奇异的矩阵所击中,因为你使用的是matlab的反斜杠,你不会发现matlab在接近奇点时会在幕后切换到最小二乘解。如果您只是将A\b
更改为linsolve(A,b)
,那么您可以限制解算器来解决方形系统,您可能会在控制台上看到很多警告。
我没有测试它,因为我不再拥有许可证,但如果我盲目地写,这应该向你显示每一步的矩阵的条件数。
err_norms = [];
range = 1:3:120;
for i=1:40
size = range(i);
A = rand(size, size);
A = tril(A);
x_gt = rand(size, 1);
b = A * x_gt;
x_sol = linsolve(A,b);
err_norms = [err_norms, norm(x_gt - x_sol)];
zzz(i) = rcond(A);
end
semilogy(range, err_norms);
figure,semilogy(range,zzz);
请注意,因为你从统一分布中获取数字,所以越来越有可能遇到病态矩阵(wrt to inversion),因为行更有可能导致排名不足。这就是错误变得越来越大的原因。将一些单位矩阵换成标量,所有错误都应该回到eps*n
级别。
但最好的是,将其留给几十年来经过测试的专家算法。写下任何这些都不是那么简单。您可以阅读Fortran代码,例如,dtrsm
解决了三角形系统。
在Python方面,您可以使用scipy.linalg.solve_triangular
使用LAPACK中的?trtrs
例程。