指数拟合数据(python)

时间:2016-02-19 00:14:38

标签: python numpy matplotlib scipy curve-fitting

您好我试图使用多项式或指数函数来拟合我的数据,而这两种方法都失败了。我使用的代码如下:

with open('argon.dat','r') as f:
    argon=f.readlines()

eng1 = np.array([float(argon[argon.index(i)].split('\n')[0].split('  ')[0])*1000 for i in argon])
II01 = np.array([1-math.exp(-float(argon[argon.index(i)].split('\n')[0].split('  ')[1])*(1.784e-3*6.35)) for i in argon])

with open('copper.dat','r') as f:
    copper=f.readlines()

eng2 = [float(copper[copper.index(i)].split('\n')[0].split('  ')[0])*1000 for i in copper]
II02 = [math.exp(-float(copper[copper.index(i)].split('\n')[0].split('  ')[1])*(8.128e-2*8.96)) for i in copper]

fig, ax1 = plt.subplots(figsize=(12,10))
ax2 = ax1.twinx()
ax1.set_yscale('log')
ax2.set_yscale('log')

arg = ax2.plot(eng1, II01, 'b--', label='Argon gas absorption at STP (6.35 cm)')
cop = ax1.plot(eng2, II02, 'r', label='Copper wall transp. (0.81 mm)')
plot = arg+cop

labs = [l.get_label() for l in plot]
ax1.legend(plot,labs,loc='lower right', fontsize=14)
ax1.set_ylim(1e-6,1)
ax2.set_ylim(1e-6,1)
ax1.set_xlim(0,160)
ax1.set_ylabel(r'$\displaystyle I/I_0$', fontsize=18)
ax2.set_ylabel(r'$\displaystyle 1-I/I_0$', fontsize=18)
ax1.set_xlabel('Photon Energy [keV]', fontsize=18)
plt.show()

这给了我Given plot of the code我想要做的不是绘制这样的数据,而是将它们拟合成指数曲线并将这些曲线相乘以最终得到探测器效率(我试图逐个元素地加倍但我不喜欢#39; t有足够的数据点以获得平滑的曲线)我尝试使用polyfit并尝试定义指数函数以查看其工作但是我在两种情况下都得到了一行

#def func(x, a, c, d):
#    return a*np.exp(-c*x)+d
#    
#popt, pcov = curve_fit(func, eng1, II01)
#plt.plot(eng1, func(eng1, *popt), label="Fitted Curve")

model = np.polyfit(eng1, II01 ,5) 
y = np.poly1d(model)
#splineYs = np.exp(np.polyval(model,eng1)) # also tried this but didnt work
ax2.plot(eng1,y)

如果需要,可以从http://www.nist.gov/pml/data/xraycoef/index.cfm获取数据 类似的工作也可以在图3中找到:http://scitation.aip.org/content/aapt/journal/ajp/83/8/10.1119/1.4923022

在@Oliver的回答之后,休息是对的:

我使用现有数据进行乘法运算:

i = 0
eff1 = []
while i < len(arg):
    eff1.append(arg[i]*cop[i])
    i += 1 

我最终得到的是(红色:铜色,蓝色虚线:氩气,蓝色:乘法)Multiplication of two curves这是我想要得到的,但是通过使用曲线的函数,这将是一条平滑的曲线,我想最终得到(根据@oliver关于错误或被误解的答案做出评论)

1 个答案:

答案 0 :(得分:6)

curvefit给你一个常数(一条平线)的原因是因为你使用你定义的模型传递了一个不相关的数据集!

让我先重新设置您的设置:

argon = np.genfromtxt('argon.dat')
copper = np.genfromtxt('copper.dat')

f1 = 1 - np.exp(-argon[:,1] * 1.784e-3 * 6.35)
f2 = np.exp(-copper[:,1] * 8.128e-2 * 8.96)

现在注意f1基于文件argon.dat中数据的第二列。它与第一列无关,虽然没有什么可以阻止你绘制第二列的修改版本与第一列的比较,这就是你绘制时所做的:

import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

plt.semilogy(copper[:,0]*1000, f2, 'r-')  # <- f2 was not based on the first column of that file, but on the 2nd. Nothing stops you from plotting those together though...
plt.semilogy(argon[:,0]*1000, f1, 'b--')
plt.ylim(1e-6,1)
plt.xlim(0, 160)

def model(x, a, b, offset):
    return a*np.exp(-b*x) + offset

备注:在您的模型中,您有一个名为b的参数未使用。传递给拟合算法总是一个坏主意。摆脱它。

现在就是诀窍:你使用指数模型基于第二列创建了f1。因此,您应将curve_fit第二列作为自变量(在function's doc-string中标记为xdata),然后f1作为因变量。像这样:

popt1, pcov = curve_fit(model, argon[:,1], f1)
popt2, pcov = curve_fit(model, cupper[:,1], f2)

这将非常有效。

现在,当您想要绘制2个图形的乘积的平滑版本时,您应该从自变量中的 common 区间开始。对你而言,这是光子能量。两个数据文件中的第二列取决于:有一个函数(一个用于氩,另一个用于铜),它将μ/ρ与光子能量相关联。因此,如果您有很多能量数据点,并且您设法获得这些功能,那么μ/ρ将有许多数据点。虽然这些功能是未知的,但我能做的最好的事情就是简单地进行插值。但是,数据是对数的,因此需要对数插值,而不是默认的线性。

现在,继续获得大量的光子能量数据点。在数据集中,能量点呈指数增长,因此您可以使用np.logspace创建一组不错的新点:

indep_var = argon[:,0]*1000
energy = np.logspace(np.log10(indep_var.min()),
                     np.log10(indep_var.max()),
                     512)  # both argon and cupper have the same min and max listed in the "energy" column.

两个数据集中的能量具有相同的最小值和最大值,这对我们有利。否则,您将不得不缩小此日志空间的范围。

接下来,我们(以对数方式)插值关系energy -> μ/ρ

interpolated_mu_rho_argon = np.power(10, np.interp(np.log10(energy), np.log10(indep_var), np.log10(argon[:,1]))) # perform logarithmic interpolation
interpolated_mu_rho_copper = np.power(10, np.interp(np.log10(energy), np.log10(copper[:,0]*1000), np.log10(copper[:,1])))

这里是对刚刚完成的事情的直观表达:

f, ax = plt.subplots(1,2, sharex=True, sharey=True)
ax[0].semilogy(energy, interpolated_mu_rho_argon, 'gs-', lw=1)
ax[0].semilogy(indep_var, argon[:,1], 'bo--', lw=1, ms=10)
ax[1].semilogy(energy, interpolated_mu_rho_copper, 'gs-', lw=1)
ax[1].semilogy(copper[:,0]*1000, copper[:,1], 'bo--', lw=1, ms=10)
ax[0].set_title('argon')
ax[1].set_title('copper')
ax[0].set_xlabel('energy (keV)')
ax[0].set_ylabel(r'$\mu/\rho$ (cm²/g)')

logarithmic interpolation

标有蓝点的原始数据集已经过精细插补。

现在,最后的步骤变得简单了。由于已经找到了将μ/ρ映射到某个指数变量(我已重命名为f1f2的函数)的模型参数,因此可以使用它们来平滑存在的数据版本,以及这两个函数的乘积:

plt.figure()
plt.semilogy(energy, model(interpolated_mu_rho_argon, *popt1), 'b-', lw=1)
plt.semilogy(argon[:,0]*1000, f1, 'bo ')

plt.semilogy(copper[:,0]*1000, f2, 'ro ',)
plt.semilogy(energy, model(interpolated_mu_rho_copper, *popt2), 'r-', lw=1) # same remark here!

argon_copper_prod = model(interpolated_mu_rho_argon, *popt1)*model(interpolated_mu_rho_copper, *popt2)
plt.semilogy(energy, argon_copper_prod, 'g-')

plt.ylim(1e-6,1)
plt.xlim(0, 160)
plt.xlabel('energy (keV)')
plt.ylabel(r'$\mu/\rho$ (cm²/g)')

enter image description here

你去吧。总结一下:

  1. 生成足够数量的自变量数据点以获得平滑结果
  2. 插入关系photon energy -> μ/ρ
  3. 将您的函数映射到插值μ/ρ