我目前正在开发一个人口统计模型来预测受石油泄漏影响的珊瑚的恢复。珊瑚的枝条可以是三种不同的状态:健康,不健康或被其他生物定殖。每年,每个分支都可以过渡到这三个州之一或中断。我已经测量了每年为同一个珊瑚(接近100个珊瑚)从一个州转移到另一个州的分支比例,为期5年,并希望使用这些数据来参数化我的人口统计模型。 我最初使用二项分布测试了三个固定变量(初始影响,关联数和珊瑚大小)对GLMM模型的影响(因为我有比例数据 - 是否发生过渡)和抽样年份。我为每次转换运行了单独的glmm模型。例如,对于健康的分支机构,我运行了以下模型:
> nv[1:4,] Coral Total Total.nv nv_to_nv nv_to_nh nv_to_hy Impact Ophiuroid Size Site Year 1 A2 63 63 63 0 0 0.00000000 1 0.7850999 MC294 2011-2012 2 A6 204 201 199 0 0 0.01578898 1 2.8842783 MC294 2011-2012 3 A10 303 108 103 3 2 0.64293344 0 6.4493261 MC294 2011-2012 4 A14 38 36 36 0 0 0.05288091 0 1.1652219 MC294 2011-2012
珊瑚:个人珊瑚ID
Total.nv:健康分支总数
nv_to_nv:保持健康的健康分支数量
nv_to_nh:变得不健康的健康分支的数量
nv_to_nv:被其他生物体定植的健康分支数量
影响:最初受影响的分支机构比例
yhh <- cbind(nv_to_nv, Total.nv - nv_to_nv)
modelhh<-glmer(yhh ~ Impact + (1 | Year) + (1 | Coral), family = binomial)
yhi <- cbind(nv_to_nh, Total.nv - nv_to_nh)
modelhi<-glmer(yhi ~ Impact + (1 | Year) + (1 | Coral), family = binomial)
yhhy <- cbind(nv_to_hy, Total.nv - nv_to_hy)
modelhhy<-glmer(yhhy ~ Impact + (1 | Year) + (1 | Coral), family = binomial)
然后我使用predict()函数为不同的Impact值独立预测每个转换,并将这些值用于我的人口统计模型。
我知道这是不准确的,因为我使用单独的glmms处理每个转换,就好像它们是独立的,但实际情况并非如此。 我认为我需要使用多项分布而不是二项式来模拟这些过渡,我不认为lme4包提供此选项。我查看了mlogit()和multinom()函数,但它们似乎都没有允许分类随机效果。
我发现使用MCMCglmm()函数可以实现多项式glmms,我想知道是否有人使用带多项glmms的predict()函数。
我还考虑将我的过渡建模为每个对比度的一系列二项式模型(“Begg和Gray Approximation”)。然后我又想知道是否有可能用这种方法做出预测。
谢谢