Scipy Curve_Fit返回值解释

时间:2013-10-24 15:32:43

标签: python math statistics scipy curve-fitting

以下是基于线性方程式使用Scipy的Curve_Fit的示例。我对Curve Fit的一般理解是,它采用随机点图并创建一条曲线来显示一系列数据点的“最佳拟合”。我的问题是使用scipy curve_fit返回:

  

“参数的最佳值,以便f(xdata,* popt) - ydata的平方误差之和最小化”。

这两个值究竟是什么意思用简单的英语?谢谢!

import numpy as np
from scipy.optimize import curve_fit
# Creating a function to model and create data
def func(x, a, b):
    return a * x + b
# Generating clean data
x = np.linspace(0, 10, 100)
y = func(x, 1, 2)
# Adding noise to the data
yn = y + 0.9 * np.random.normal(size=len(x))
# Executing curve_fit on noisy data
popt, pcov = curve_fit(func, x, yn)
# popt returns the best fit values for parameters of
# the given model (func).
print(popt)

1 个答案:

答案 0 :(得分:4)

你要求SciPy通过一组点(x,y)告诉你“最佳”线。

这是一条直线的等式:

y = a*x + b

该行的斜率为a; y轴截距为b

您有两个参数,ab,所以您只需要两个方程来解决两个未知数。两点定义一条线,对吗?

那么当你有超过两分时会发生什么?你不能通过所有点。你如何选择斜率和截距来给你“最佳”线?

一种方法是定义“最佳”是计算斜率和截距,以最小化每个y值与线上该x处的预测y之差的平方:

error = sum[(y(i) - (a*x(i) + b))^2]

如果你知道微积分,这是一个简单的练习:取错误的第一个导数w.r.t. ab并将它们设置为零。你将有两个带有两个未知数的方程,ab。你解决它们来获得“最佳”线的系数。