Pyir 3中的Dirichlet过程

时间:2014-09-05 11:40:07

标签: pymc theano dirichlet pymc3

我想实现实现中引用的Dirichlet流程示例 在PyMC 3中Implementing Dirichlet processes for Bayesian semi-parametric models(来源:here)。

在示例中,使用pymc.deterministic计算断纸概率 装饰器:

v = pymc.Beta('v', alpha=1, beta=alpha, size=N_dp)
@pymc.deterministic
def p(v=v):
    """ Calculate Dirichlet probabilities """

    # Probabilities from betas
    value = [u*np.prod(1-v[:i]) for i,u in enumerate(v)]
    # Enforce sum to unity constraint
    value[-1] = 1-sum(value[:-1])

    return value

 z = pymc.Categorical('z', p, size=len(set(counties)))

如何在使用Theano进行渐变计算的PyMC 3中实现这一点?

编辑: 我使用theano.scan方法尝试了以下解决方案:

with pm.Model() as mod:
    conc = Uniform('concentration', lower=0.5, upper=10)
    v = Beta('v', alpha=1, beta=conc, shape=n_dp)
    p, updates = theano.scan(fn=lambda stick, idx: stick * t.prod(1 - v[:idx]),
                             outputs_info=None,
                             sequences=[v, t.arange(n_dp)])
    t.set_subtensor(p[-1], 1 - t.sum(p[:-1]))
    category = Categorical('category', p, shape=n_algs)
    sd = Uniform('precs', lower=0, upper=20, shape=n_dp)
    means = Normal('means', mu=0, sd=100, shape=n_dp)
    points = Normal('obs',
                    means[category],
                    sd=sd[category],
                    observed=data)

    step1 = pm.Slice([conc, v, sd, means])
    step3 = pm.ElemwiseCategoricalStep(var=category, values=range(n_dp))
    trace = pm.sample(2000, step=[step1, step3], progressbar=True)

遗憾的是,它很慢并且没有获得合成数据的原始参数。

是否有更好的解决方案,这是否正确?

1 个答案:

答案 0 :(得分:1)

不确定我有一个好的答案,但也许可以通过使用theano blackbox op来加速,这允许你在python代码中编写分布(或确定性)。例如:https://github.com/pymc-devs/pymc3/blob/master/pymc3/examples/disaster_model_arbitrary_deterministic.py