Question

大家好，

很抱歉，这个问题是微不足道的，还是以前曾被问过。我已经搜索过，但找不到令人满意的答案。由于我是一名行业生态学家，因此我对统计建模不是很熟悉。所以，请忍受我。

简而言之，我们在接受不同处理的地块中具有包含昆虫计数的数据集（这些数据通常报告为每平方米的个体数，因此我想使用它）。我们有两年的数据（对相同的地块进行了采样），并且从一半的地块中排除了食草动物（放下了笼子），而其他地方则被放牧了。因此，我想知道处理方法是否对动物数量有影响，是否与年份有相互作用，以及草食动物对不同年份和处理方法中的动物数量是否有影响。基本上是这样的：

Block    Treatment    Year       Herbivory    animals.sq.m
1-10     1-4          2004-2016  no/yes       0.125

我现在使用的模型是这样的

library(lmerTest)    
model<-lmer(Total_surface~Treatment*Year*Cage + (1 | Block), data=collembola1)

我认为这个模型足以回答我的生态问题。

我现在怀疑这些是计数数据，并且该模型可能无法正确运行。我使用下面的代码计算了均值和方差。方差比均值大得多（所以我假设我不能使用泊松分布？）。我的问题是实际上应该使用哪种分布以及如何使用。另外，在异方差的情况下，像我的这样对数据进行对数转换通常被认为可以吗？

dispersionstats_collembola <- collembola1 %>%
group_by(Treatment, Year) %>%`
summarise( means = mean(Total_surface),
    variances = var(Total_surface),
    ratio = variances/means)
    dispersionstats_collembola

非常感谢。

在lmer模型中使用什么分布？

0 个答案: