您好我想问我的同伴python用户如何执行他们的线性拟合。
我一直在搜索方法/库的最后两周来执行此任务,我想分享我的经验:
如果您想基于最小二乘法执行线性拟合,您有很多选择。例如,您可以在numpy和scipy中找到类。我自己选择了linfit提出的那个(遵循IDL中linfit函数的设计):
http://nbviewer.ipython.org/github/djpine/linfit/blob/master/linfit.ipynb
此方法假设您在y轴坐标中引入sigmas以适合您的数据。
但是,如果你已经量化了x轴和y轴的不确定性,那么就没有多少选择。 (没有IDL" Fitexy"相当于主要的python科学图书馆)。到目前为止,我只找到了" kmpfit"库来执行此任务。幸运的是,它有一个非常完整的网站,描述了它的所有功能:
https://github.com/josephmeiring/kmpfit http://www.astro.rug.nl/software/kapteyn/kmpfittutorial.html#
如果有人知道其他方法,我也很想知道它们。
无论如何,我希望这会有所帮助。
答案 0 :(得分:20)
Orthogonal distance regression允许您使用x
和y
中的错误进行非线性拟合。
下面显示的是一个基于scipy页面上给出的示例的简单示例。它试图将二次函数拟合到一些随机数据中。
import numpy as np
import matplotlib.pyplot as plt
from scipy.odr import *
import random
# Initiate some data, giving some randomness using random.random().
x = np.array([0, 1, 2, 3, 4, 5])
y = np.array([i**2 + random.random() for i in x])
x_err = np.array([random.random() for i in x])
y_err = np.array([random.random() for i in x])
# Define a function (quadratic in our case) to fit the data with.
def quad_func(p, x):
m, c = p
return m*x**2 + c
# Create a model for fitting.
quad_model = Model(quad_func)
# Create a RealData object using our initiated data from above.
data = RealData(x, y, sx=x_err, sy=y_err)
# Set up ODR with the model and data.
odr = ODR(data, quad_model, beta0=[0., 1.])
# Run the regression.
out = odr.run()
# Use the in-built pprint method to give us results.
out.pprint()
'''Beta: [ 1.01781493 0.48498006]
Beta Std Error: [ 0.00390799 0.03660941]
Beta Covariance: [[ 0.00241322 -0.01420883]
[-0.01420883 0.21177597]]
Residual Variance: 0.00632861634898189
Inverse Condition #: 0.4195196193536024
Reason(s) for Halting:
Sum of squares convergence'''
x_fit = np.linspace(x[0], x[-1], 1000)
y_fit = quad_func(out.beta, x_fit)
plt.errorbar(x, y, xerr=x_err, yerr=y_err, linestyle='None', marker='x')
plt.plot(x_fit, y_fit)
plt.show()
答案 1 :(得分:7)
您可以使用与最大特征值关联的协方差矩阵的特征向量来执行线性拟合。
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(6, dtype=float)
y = 3*x + 2
x += np.random.randn(6)/10
y += np.random.randn(6)/10
xm = x.mean()
ym = y.mean()
C = np.cov([x-xm,y-ym])
evals,evecs = np.linalg.eig(C)
a = evecs[1,evals.argmax()]/evecs[0,evals.argmax()]
b = ym-a*xm
xx=np.linspace(0,5,100)
yy=a*xx+b
plt.plot(x,y,'ro',xx,yy)
plt.show()