Scipy.optimize不适合我的数据

时间:2016-09-30 23:38:06

标签: python numpy math scipy best-fit-curve

我无法让scipy.optimize.curve_fit正确拟合我的数据,这在视觉上是显而易见的。我大致知道参数值应该是什么,如果我用给定的参数评估函数,计算和实验数据似乎都很好:

calculated and experimental data

然而,当我使用scipy.optimize.curve_fit时,具有最小误差的输出参数更适合(通过目视检查)。如果我使用"已知"参数作为我的初始猜测,并将参数绑定到一个相对较窄的窗口,如fit函数的输出示例所示:

example of output from fit function

我获得的误差值大约10 ^ 2倍,但拟合的视觉外观似乎更好。我可以获得适合数据的唯一方法是将所有参数绑定到〜0.3单位的"已知"参数。我打算使用这个代码来拟合更复杂的数据,我不会事先知道参数,所以我不能只使用计算出的图。

相关代码如下:

import matplotlib.pyplot as plt
import numpy as np
import scipy
from scipy.optimize import curve_fit
d_1= 2.72 #Anstroms
sig_cp_1= 0.44
sig_int_1= 1.03
d_1, sig_cp_1,sig_int_1=float(d_1),float(sig_cp_1),float(sig_int_1)
Ref=[]
Qz_F=[]
Ref_F=[]
g=open("Exp_Fresnal.csv",'rb')#"Test_Fresnal.csv", 'rb')
reader=csv.reader(g)
for row in reader:
    Qz_F.append(row[0])
    Ref.append(row[1])
    Ref_F.append(row[2])
Ref=map(lambda a:float(a),Ref)
Ref_F=map(lambda a:float(a),Ref_F)
Qz_F=map(lambda a:float(a),Qz_F)
Ref_F_arr=np.array((Ref_F))
Qz_arr=np.array((Qz_F))
x=np.array((Qz_arr,Ref_F))
def func(x,d,sig_int,sig_cp):
     return (x[1])*(abs(x[0]*d*(np.exp((-sig_int**2)*(x[0]**2)/2)/(1-np.exp(complex(0,1)*x[0]*d)*np.exp((-sig_cp**2)*(x[0]**2)/2)))))**2
DC_ref=func(x,d_1,sig_int_1,sig_cp_1)
Y=np.array((Ref))
popt, pcov=curve_fit(func,x,Y,)#p0=[2.72,1.0,0.44])
perr=np.sqrt(np.diag(pcov))
print "par=",popt;print"Var=",perr
Fit=func(x,*popt)
Fit=func(x,*popt)
Ref=np.transpose(np.array([Ref]))
Qz_F=np.transpose(Qz_F)

plt.plot(Qz_F, Ref, 'bs',label='Experimental')
plt.plot(Qz_F, Fit, 'r--',label='Fit w/ DCM model')
plt.axis([0,3,10**(-10),100])
plt.yscale('log')
plt.title('Reflectivity',fontweight='bold',fontsize=15)
plt.ylabel('Reflectivity',fontsize=15)
plt.xlabel('qz /A^-1',fontsize=15)
plt.legend(loc='upper right',numpoints=1) 
plt.show()

数组是从一个文件中导入的(我不能包含它),并且没有任何异常点可能会导致拟合失真。任何帮助表示赞赏。

修改 我添加了额外的代码和input data以及代码,但您必须将其重新保存为MS-Dos .CSV

1 个答案:

答案 0 :(得分:3)

@WarrenWeckesser has a really good point,但进一步注意到y轴是对数的。在右端显然是巨大的误差,大小为1e-5,而左上角的点的反射率值约为0.1。与左边的巨大项相比,来自尾部的平方误差是微不足道的。

我确定curve_fit效果很好。如果你想要更好的视觉效果,我建议你尝试使用模型的log(y)来拟合log()(或者在拟合期间加权你的点数);那么结果可能在视觉上更稳定(并且从物理的角度来看)。由于您可能尝试对系统进行全面的广谱描述,因此可能更接近您的预期(但这将不可避免地导致在反射率较高的情况下不太精确拟合)。