在being unsuccessful in using decorators定义“指数随机变量的对数”的随机对象之后,我决定使用pymc.stochastic_from_dist
手动编写这个新分布的代码。我想在这里实现的模型(第一个模型):
现在,当我尝试使用MCMC Metropolis和正态分布作为提案对日志(alpha)进行采样时(如下图所示,作为采样方法),我收到以下错误:
File "/Library/Python/2.7/site-packages/pymc/distributions.py", line 980, in rdirichlet
return (gammas[0]/gammas[0].sum())[:-1]
FloatingPointError: invalid value encountered in divide
虽然采样不会出错的时间,但采样直方图与本文中的采样直方图相匹配。我的分层模型是:
"""
A Hierarchical Bayesian Model for Bags of Marbles
logalpha ~ logarithm of an exponential distribution with parameter lambd
beta ~ Dirichlet([black and white ball proportions]:vector of 1's)
theta ~ Dirichlet(alpha*beta(vector))
"""
import numpy as np
import pymc
from scipy.stats import expon
lambd=1.
__all__=['alpha','beta','theta','logalpha']
#------------------------------------------------------------
# Set up pyMC model: logExponential
# 1 parameter: (alpha)
def logExp_like(x,explambda):
"""log-likelihood for logExponential"""
return -lambd*np.exp(x)+x
def rlogexp(explambda, size=None):
"""random variable from logExponential"""
sample=np.random.exponential(explambda,size)
logSample=np.log(sample)
return logSample
logExponential=pymc.stochastic_from_dist('logExponential',logp=logExp_like,
random=rlogexp,
dtype=np.float,
mv=False)
#------------------------------------------------------------
#Defining model parameteres alpha and beta.
beta=pymc.Dirichlet('beta',theta=[1,1])
logalpha=logExponential('logalpha',lambd)
@pymc.deterministic(plot=False)
def multipar(a=logalpha,b=beta):
out=np.empty(2)
out[0]=(np.exp(a)*b)
out[1]=(np.exp(a)*(1-b))
return out
theta=pymc.Dirichlet('theta',theta=multipar)
我的测试抽样代码是:
from pymc import Metropolis
from pymc import MCMC
from matplotlib import pyplot as plt
import HBM
import numpy as np
import pymc
import scipy
M=MCMC(HBM)
M.use_step_method(Metropolis,HBM.logalpha, proposal_sd=1.,proposal_distribution='Normal')
M.sample(iter=1000,burn=200)
当我在distributions.py的第978行检查传递给gamma分布的theta的值时,我发现没有零但是值很小!所以我不知道如何防止这个浮点错误?
答案 0 :(得分:1)
我在他们的文档中发现了这个nugget:
随机变量的临界值不能小于D的最大元素,否则D的密度将为零。标准的Metropolis步骤方法可以毫无问题地处理这种情况。偶尔会提出非法价值,但这些价值会被拒绝。
这会让我相信dtype=np.float
(必不可少的范围与float相同)可能不是您要使用的方法。文档说它必须是一个numpy dtype,但只需要一个转换为numpy dtype对象的dtype,在Python2中(如果我错了,请纠正我),数字dtype是固定大小的类型,这意味着它们是相同的。也许可以使用Decimal模块。这样,您可以设置精度级别以封装期望值范围,然后将其传递给扩展的随机方法,在该方法中将对其进行转换。
from decimal import Decimal, getcontext
getcontext().prec = 15
dtype=Decimal
我不知道一旦numpy库掌握了它,或者它是否尊重继承的精度水平,它还是不会被截断。我没有准确的测试方法,请尝试一下,让我知道它对您的工作原理。
编辑:我测试了精度继承的概念,它似乎成立了:
>>> from decimal import Decimal, getcontext
>>> getcontext().prec = 10
>>> Decimal(1) / Decimal(7)
Decimal('0.1428571429')
>>> np.float(Decimal(1) / Decimal(7))
0.1428571429
>>> getcontext().prec = 15
>>> np.float(Decimal(1) / Decimal(7))
0.142857142857143
>>>
答案 1 :(得分:0)
如果你得到的数字很小,那么浮动可能只是太小了。这通常也是对数要避免的对象。如果您使用dtype=np.float64
怎么办?
答案 2 :(得分:0)
正如您在问题末尾所建议的那样,问题是浮点型转换为0的数字太小。一种解决方案是调整一些源代码,并用np.divide等代替除法。并在“ where”条件下将一些显式强制转换为给定阈值的较小值。