带有bam的零膨胀模型(ziP)出错

时间:2017-11-07 08:16:09

标签: r poisson gam mgcv

我正在尝试使用bam来运行以下广义加法模型:

m <- bam(result ~ factor(city) + factor(year) + lnpopulation + s(lnincome), data=full_df, na.action=na.omit, family=ziP(theta = NULL, link = "identity",b=0))

但是收到以下错误:

  

bam出错(结果:bam不支持扩展系列

bam的文档提及以下内容:

  

这是一个系列对象,指定要使用的分布和链接   拟合等。有关详细信息,请参阅glm和family。扩展   在family.mgcv中列出的家庭也可以使用。

family.mgcv确实包含了ziP。我究竟做错了什么?任何指导将不胜感激。谢谢!

从r-help重新发布。

此致

麋鹿

1 个答案:

答案 0 :(得分:1)

错误消息表明您使用的 mgcv 版本不支持 mgcv gam()功能支持的扩展系列。

值得庆幸的是,您的问题的解决方案是微不足道的,因为Simon Wood现在已经在版本1.8-19中实现了此功能(bam()内的扩展系列),如ChangeLog中所述:

  

1.8-19

     

** bam()现在接受扩展系列(即nbtwocat等)

当前版本是1.8-22,它修复了与您要查找的功能相关的一些错误,因此请确保您更新到最新版本。

以下是从?ziP

修改的示例
 ## function to simulated zip data

 rzip <- function(gamma,theta= c(-2,.3)) {
 ## generate zero inflated Poisson random variables, where 
 ## lambda = exp(gamma), eta = theta[1] + exp(theta[2])*gamma
 ## and 1-p = exp(-exp(eta)).
   y <- gamma; n <- length(y)
   lambda <- exp(gamma)
   eta <- theta[1] + exp(theta[2])*gamma
   p <- 1- exp(-exp(eta))
   ind <- p > runif(n)
   y[!ind] <- 0
   np <- sum(ind)
   ## generate from zero truncated Poisson, given presence...
   y[ind] <- qpois(runif(np,dpois(0,lambda[ind]),1),lambda[ind])
   y
 } 

 library('mgcv')

 ## Simulate some ziP data...
 set.seed(1);n<-400
 dat <- gamSim(1,n=n)
 dat$y <- rzip(dat$f/4-1)

 b <- bam(y ~ s(x0) + s(x1) + s(x2) + s(x3),
          family = ziP(), data = dat)

这给了我以下适合的模型:

> summary(b)

Family: Zero inflated Poisson(-1.855,1.244) 
Link function: identity 

Formula:
y ~ s(x0) + s(x1) + s(x2) + s(x3)

Parametric coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.97426    0.04988   19.53   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Approximate significance of smooth terms:
        edf Ref.df      F p-value    
s(x0) 2.396  2.989  2.336  0.0759 .  
s(x1) 2.784  3.464 77.217  <2e-16 ***
s(x2) 7.397  8.317 59.364  <2e-16 ***
s(x3) 1.235  1.428  0.269  0.5888    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Deviance explained =   69%
fREML = 593.94  Scale est. = 1         n = 400