我有一个20个实数的向量X和一个20个实数的向量Y.
我想将它们建模为
y = ax^2+bx + c
如何找到'a','b'和'c'的值 并且最适合二次方程。
给定值
X = (x1,x2,...,x20)
Y = (y1,y2,...,y20)
我需要一个公式或程序来查找以下值
a = ???
b = ???
c = ???
提前致谢。
答案 0 :(得分:2)
那是linear least squares problem。我认为提供准确结果的最简单方法是QR decomposition using Householder reflections。它不是在stackoverflow答案中解释的,但我希望你能找到这个链接所需要的一切。
如果您之前从未听说过这些,并且不知道它与您的关系如何:
A = [[x1^2, x1, 1]; [x2^2, x2, 1]; ...]
Y = [y1; y2; ...]
现在您要查找v = [a; b; c]
,A*v
尽可能接近Y
,这正是最小二乘问题的全部内容。
答案 1 :(得分:2)
@Bartoss所说的一切都是对的,+ 1。我想我只是在这里添加一个实际的实现,没有QR分解。您想要评估a,b,c的值,以使测量数据和拟合数据之间的距离最小。你可以选择衡量标准
sum(ax^2+bx + c -y)^2)
其中总和超过向量x,y的元素。
然后,最小值意味着相对于a,b,c中每一个的数量的导数为零:
d (sum(ax^2+bx + c -y)^2) /da =0
d (sum(ax^2+bx + c -y)^2) /db =0
d (sum(ax^2+bx + c -y)^2) /dc =0
这些方程是
2(sum(ax^2+bx + c -y)*x^2)=0
2(sum(ax^2+bx + c -y)*x) =0
2(sum(ax^2+bx + c -y)) =0
除以2,上述内容可以改写为
a*sum(x^4) +b*sum(x^3) + c*sum(x^2) =sum(y*x^2)
a*sum(x^3) +b*sum(x^2) + c*sum(x) =sum(y*x)
a*sum(x^2) +b*sum(x) + c*N =sum(y)
在你的情况下N=20
。 python中的一个简单代码显示了如何执行此操作。
from numpy import random, array
from scipy.linalg import solve
import matplotlib.pylab as plt
a, b, c = 6., 3., 4.
N = 20
x = random.rand((N))
y = a * x ** 2 + b * x + c
y += random.rand((20)) #add a bit of noise to make things more realistic
x4 = (x ** 4).sum()
x3 = (x ** 3).sum()
x2 = (x ** 2).sum()
M = array([[x4, x3, x2], [x3, x2, x.sum()], [x2, x.sum(), N]])
K = array([(y * x ** 2).sum(), (y * x).sum(), y.sum()])
A, B, C = solve(M, K)
print 'exact values ', a, b, c
print 'calculated values', A, B, C
fig, ax = plt.subplots()
ax.plot(x, y, 'b.', label='data')
ax.plot(x, A * x ** 2 + B * x + C, 'r.', label='estimate')
ax.legend()
plt.show()
实现解决方案的一种更快的方法是使用非线性最小二乘算法。写入速度会更快,但运行速度不快。使用scipy
提供的那个,
from scipy.optimize import leastsq
def f(arg):
a,b,c=arg
return a*x**2+b*x+c-y
(A,B,C),_=leastsq(f,[1,1,1])#you must provide a first guess to start with in this case.