R中的伽玛分布下限

时间:2016-12-26 17:23:00

标签: r threshold gamma-distribution fitdistrplus

我想将伽玛分布拟合到由338个元素构成的数据集中,具有固定的低阈值(我使用的是R)。 为了表示下限,我想使用带有三个参数的gamma,添加位置。这是我的代码:

library(FAdist)
library(fitdistrplus)
fit <- fitdist(mydata,"gamma3",start=list(1,1,mythreshold))

每次我运行代码时,都会遇到同样的错误:

<simpleError in optim(par = vstart, fn = fnobj, fix.arg = fix.arg, obs = data,     gr = gradient, ddistnam = ddistname, hessian = TRUE, method = meth,     lower = lower, upper = upper, ...): non-finite finite-difference value [3]>
Error in fitdist(Hs, "gamma3", start = list(1, 1, 3)) : 
  the function mle failed to estimate the parameters, 
                with the error code 100

所以我试着改变起始值,使用伽玛拟合得到的两个参数,得到了这个结果:

fit <- fitdist(mydata,"gamma")
fit
Fitting of the distribution ' gamma ' by maximum likelihood 
Parameters:
       estimate Std. Error
shape 21.417503  1.6348313
rate   5.352422  0.4133735

但它仍然不起作用..即使带有两个参数的伽玛也不起作用,我会理解它,但事实并非如此,我不能给自己一个解释。此外,具有两个参数的伽马的QQ图和ecdf不太好......但是如果我适合相对于低阈值缩放的原始数据集上的分布,那么拟合看起来很完美:

fit <- fitdist(mydata-mythreshold,"gamma")
fit
Fitting of the distribution ' gamma ' by maximum likelihood 
Parameters:
      estimate Std. Error
shape 1.059540 0.07212832
rate  1.058007 0.09117620

但后来我不知道这样做是否正确......参数非常不同,我需要它们来计算与我的数据相关的返回周期!这就是我用位置参数考虑伽玛的原因。

P.S。我没有附加数据,因为它们太多,但我可以报告它们的摘要:

 summary(mydata)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  3.003   3.282   3.753   4.001   4.444   8.087 

1 个答案:

答案 0 :(得分:1)

设置可重现的示例;

library(FAdist); library(fitdistrplus)
set.seed(101)
x <- rgamma3(1000,shape=1,scale=1,thres=1)

对于阈值参数的值大于数据集中的最小值,似然性是无限的(因为这些值应该是不可能的/在截断分布下具有零值)。我们可以通过设置此参数的上限来使事情有效:

fitdist(x,dgamma3,start=list(shape=1,scale=1,thres=0.5),
        upper=c(Inf,Inf,min(x)))
## Fitting of the distribution ' gamma3 ' by maximum likelihood 
## Parameters:
##        estimate Std. Error
## shape 0.9321949         NA
## scale 1.0586079         NA
## thres 1.0000012         NA

注意(1)在最大似然下,这种阈值参数总是以它可以采用的最大值(即数据集中的最小值)结束; (2)标准误差为NA,因为当参数达到边界时,无法计算Wald标准误差。

或者,您可以通过定义包装函数来修复阈值参数:

dgconstr <- function(x,shape,scale,...) {
    dgamma3(x,shape,scale,thres=0.5,...)
}
pgconstr <- function(...) {
    pgamma3(...,thres=0.5)
}

fitdist(x,dgconstr,start=list(shape=1,scale=1))