在R中用GEE模拟负二项分布数据的任何更新?

时间:2018-03-03 21:37:57

标签: r glm gee

目标:使用负二项分布运行GEE以分析R

中的数据集

这个问题被问到here,但答案是〜5岁,我想知道是否有新的发展。我总结了我的数据,然后概述了我是如何尝试找到解决方案的。

我的模型(使用Poisson而不是使用包geeglm的负二项分布成功运行):

m1 <- geeglm(Diract ~ Dir*Rec + Year + offset(LnScan), 
             family = poisson("log"), data = Direct, id = ID, corstr = "exchangeable")

数据为here

Diract :区间结果变量,董事(B组或C组中的“Dir”)与收件人的行为计数(A组,B组或C组的“Rec”)。范围从0开始-4,过度分散。
Dir * Rec :感兴趣的主要预测因子,两个因素的相互作用(导演和接受者组)。动物属于3组(生命阶段)之一:A,B,C 年度:数据收集年份(2010年,2011年,2012年) 目标系列:具有日志链接功能的负二项式

在三年的学习期间,有些人(约5人)在数据收集期间从一个群体转变为另一个群体。我为每位董事制定了多项措施(年内和年内)。例如,对于整个研究而言活着的个体具有针对三年研究中的每一个的针对A,B和C组的行为的计数(总计= 9计数)。有些人在三年内被观察到,有些人只被观察了一两年。

最初我在SPSS中使用了GEE,我可以访问的软件。在SPSS中,QIC值表明负二项式更适合我的数据与Poisson。

通过上面的Stackoverflow链接建议

Solution1 :使用library("sos")findFn("{generalized estimating equation}")查找运行GEE的R中的软件包。我检查了建议的所有14个包。 geepack缺乏负二项式家庭; ZeligJGEEpseudoaftgeeetmwgeeselMethylCapSigmiLineage杠杆{ {1}}。 geepackMESSPGEEspind缺少负二项式,threeboost仅用于序数结果。

Ben Bolker在Nabble上建议

Solution2 :“我会在MASS包中尝试glmmPQL。我认为你不能完全获得负二项式以这种方式回归,但你绝对可以得到一个quasipoisson模型。我认为可以交换 correlation对应于glmmPQL命令中的correlation = corCompSymm()。“

我的错误消息尝试:

repolr
  

glmmPQL出错(Diract~DirPar * RecPar + offset(LnScan)+年,随机= ~1 |:找不到函数“corCompSymm”

如果有人有提示或解决方案,我会对任何事情持开放态度。非常感谢你!

1 个答案:

答案 0 :(得分:0)

多年来,这个问题被问过很多次,遇到相同的问题并寻找答案几个小时后,我遇到了这个问题。两种解决方案:

  1. geeM软件包允许使用负二项式族
  2. 通过R reticulate包导入python statsmodels模块并调用R中的gee拟合函数,该函数允许负二项式族