我有一个非常简单的例子似乎不起作用。我的目标是建立一个Lomax模型,由于PyMC3没有Lomax分布,我使用的事实是与Gamma混合的指数是一个Lomax(见here):
import pymc3 as pm
from scipy.stats import lomax
# Generate artificial data with a shape and scale parameterization
data = lomax.rvs(c=2.5, scale=3, size=1000)
# if t ~ Exponential(lamda) and lamda ~ Gamma(shape, rate), then t ~ Lomax(shape, rate)
with pm.Model() as hierarchical:
shape = pm.Uniform('shape', 0, 10)
rate = pm.Uniform('rate', 0 , 10)
lamda = pm.Gamma('lamda', alpha=shape, beta=rate)
t = pm.Exponential('t', lam=lamda, observed=data)
trace = pm.sample(1000, tune=1000)
摘要是:
>>> pm.summary(trace)
mean sd mc_error hpd_2.5 hpd_97.5 n_eff Rhat
shape 4.259874 2.069418 0.060947 0.560821 8.281654 1121.0 1.001785
rate 6.532874 2.399463 0.068837 2.126299 9.998271 1045.0 1.000764
lamda 0.513459 0.015924 0.000472 0.483754 0.545652 1096.0 0.999662
我预计形状和速率估计值分别接近2.5和3。我尝试了各种非信息先验的形状和速率,包括pm.HalfFlat()
和pm.Uniform(0, 100)
,但两者都导致了更糟糕的情况。有什么想法吗?
答案 0 :(得分:0)
想出来:要从指数-γ混合中导出lomax,我需要为数据集(lamda
)中的每个示例指定lamda = pm.Gamma('lamda', alpha=shape, beta=rate, shape=len(data)
。这是因为模型假设数据中的每个主题都有自己的lamda_i
,其中lamda_i ~ Gamma(shape, rate)
为i
。{/ p>