创建具有二项式响应和类别/连续变量混合的GLMM

时间:2019-07-12 17:19:14

标签: r lme4 mixed-models random-effects

我正在分析几个两栖动物目击事件(6000多个记录),以了解哪些环境变量会影响两栖动物的有无。 每个两栖动物物种的响应变量是一个逻辑矢量(对,错),环境因素包括连续的数值(道路距离,池塘距离)和分类变量(月,年,面积)。 我创建了一个按比例缩小数值变量的通用线性混合模型(GLMM,程序包lme4),然后选择Area(出现瞄准点)作为随机效果。

-缩放比例/ 100是否可以接受?道路距离和池塘距离以米为单位。并且通常包含大量数字(3000m等)。缩放也删除了该模型最初给我的重新缩放错误消息。

-随机效果会按预期(1 | Area)起作用吗?我不确定此功能的合奏性。

谢谢。

这是我创建的两栖动物模型之一:

C.TOAD.BI<-glmer(C.TOAD~+Habitat.type+I(pond.dist/100)+I(road.dist/100)+I(urban.dist/100)+Year+Month+(1|Area), family = binomial(link="logit"),data = Amphibians)

1 个答案:

答案 0 :(得分:0)

您用来指定随机效果结构的语法将起作用。您提供的模型称为随机拦截模型,在您的情况下,它将为数据中的每个区域估计一个随机拦截。

对于缩放问题,建议您先将pond.distroad.dist居中,然后再重新缩放。没有数据样本很难,但是我相信下面的代码可以工作(使用tidyverse函数)来居中变量。如果您使用中心池塘距离和道路距离重新运行模型,但仍然收到缩放问题,以我的经验,可以将变量值除以一个常数就可以消除缩放问题。如果您这样做,只需了解解释的变化即可。

Amphibians %>% group_by(Area) %>% mutate(pond.dist_c = pond.dist - mean(pond.dist), road.dist_c = road.dist - mean(road.dist))

以区域为中心时,这些效果的解释将有所变化。就池塘距离而言,您应将其解释为与两栖动物目击记录对数几率的估计增加有关,这与池塘距离相对于一个区域的平均池塘距离的增加相关。

如果愿意,还可以在模型中指定随机效果。可以通过将随机变量语法中随Area变化的任何变量添加来完成这些操作。例如,(1 + pond.dist | Area)。这将使模型可以估计每个区域的池塘距离的独特影响。