在lmer模型中使用什么分布?

时间:2018-08-14 12:01:47

标签: distribution lme4 lmertest

大家好,

很抱歉,这个问题是微不足道的,还是以前曾被问过。我已经搜索过,但找不到令人满意的答案。由于我是一名行业生态学家,因此我对统计建模不是很熟悉。所以,请忍受我。

简而言之,我们在接受不同处理的地块中具有包含昆虫计数的数据集(这些数据通常报告为每平方米的个体数,因此我想使用它)。我们有两年的数据(对相同的地块进行了采样),并且从一半的地块中排除了食草动物(放下了笼子),而其他地方则被放牧了。因此,我想知道处理方法是否对动物数量有影响,是否与年份有相互作用,以及草食动物对不同年份和处理方法中的动物数量是否有影响。基本上是这样的:

Block    Treatment    Year       Herbivory    animals.sq.m
1-10     1-4          2004-2016  no/yes       0.125

我现在使用的模型是这样的

library(lmerTest)    
model<-lmer(Total_surface~Treatment*Year*Cage + (1 | Block), data=collembola1)

我认为这个模型足以回答我的生态问题。

我现在怀疑这些是计数数据,并且该模型可能无法正确运行。我使用下面的代码计算了均值和方差。方差比均值大得多(所以我假设我不能使用泊松分布?)。我的问题是实际上应该使用哪种分布以及如何使用。另外,在异方差的情况下,像我的这样对数据进行对数转换通常被认为可以吗?

dispersionstats_collembola <- collembola1 %>%
group_by(Treatment, Year) %>%`
summarise( means = mean(Total_surface),
    variances = var(Total_surface),
    ratio = variances/means)
    dispersionstats_collembola

非常感谢。

0 个答案:

没有答案