如何计算模拟值,同时绘制差异图以确定拟合度?

时间:2015-08-31 21:16:19

标签: python pymc mcmc goodness-of-fit

我试图在使用pymc获得MCMC获得最佳拟合值后,制作用于测试拟合优度的差异图。我的代码如下:

import pymc
import numpy as np
import matplotlib.pyplot as plt, seaborn as sns

# Seeding 
np.random.seed(55555)

# x-data
x = np.linspace(1., 50., 50)

# Gaussian function
def gaus(x, A, x0, sigma): 
        return A*np.exp(-(x-x0)**2/(2*sigma**2))

# y-data
f_true = gaus(x, 10., 25., 10.)
noise = np.random.normal(size=len(f_true)) * 0.2
f = f_true + noise

# y_error
f_err = f*0.05

# Defining the model
def model(x, f):
    A = pymc.Uniform('A', 0., 50., value = 12)
    x0 = pymc.Uniform('x0', 0., 50., value = 20)
    sigma = pymc.Uniform('sigma', 0., 30., value=8)

    @pymc.deterministic(plot=False)
    def gaus(x=x, A=A, x0=x0, sigma=sigma): 
        return A*np.exp(-(x-x0)**2/(2*sigma**2))
    y = pymc.Normal('y', mu=gaus, tau=1.0/f_err**2, value=f, observed=True)
    return locals()

MDL = pymc.MCMC(model(x,f))
MDL.sample(20000, 10000, 1)


# Extract best-fit parameters

A_bf, A_unc = MDL.stats()['A']['mean'], MDL.stats()['A']['standard deviation']
x0_bf, x0_unc = MDL.stats()['x0']['mean'], MDL.stats()['x0']['standard deviation'] 
sigma_bf, sigma_unc = MDL.stats()['sigma']['mean'], MDL.stats()['sigma']['standard deviation']

# Extract and plot results
y_fit = MDL.stats()['gaus']['mean']

plt.clf()
plt.errorbar(x, f, yerr=f_err, color='r', marker='.', label='Observed')
plt.plot(x, y_fit, 'k', ls='-', label='Fit')
plt.legend()
plt.show()

到目前为止一直很好,并给出了以下情节:Best fit plot using MCMC

现在我想测试https://pymc-devs.github.io/pymc/modelchecking.html中第7.3节所述的使用方法的拟合优度。为此,我必须首先找到f_sim,所以我在上面的行之后写了下面的代码:

# GOF plot
f_sim = pymc.Normal('f_sim', mu=gaus(x, A_bf, x0_bf, sigma_bf), tau=1.0/f_err**2, size=len(f))
pymc.Matplot.gof_plot(f_sim, f, name='f')
plt.show()

这会出错 AttributeError:' Normal'对象没有属性' trace' 。我想在做差异图之前使用gof_plot。我不认为使用其他分布代替普通是一个好主意,因为函数的高斯性质。如果有人能让我知道我做错了什么,我真的很感激。 pymc中的正态分布也没有Normal_expval来获得期望值。有没有其他方法可以计算f_exp?感谢。

1 个答案:

答案 0 :(得分:0)

我意识到f_sim实际上是在主拟合期间定义的y值,因为模拟值是montecarlo方法的主干。所以我提取了最后10000次迭代的y值并使用了gof_plot,如下所示:

f_sim = MDL.trace('gaus', chain = None)[:]
pymc.Matplot.gof_plot(f_sim, f, name='f')
plt.show()

现在很棒!仍不确定如何获得f_exp。