将GLM与Poisson或Negative二项式与Count数据一起使用

时间:2016-08-19 11:56:19

标签: r plot glm

我目前正在尝试为R中的数据运行glm,我正在尝试了解我是否使用了最佳模型。

我的数据是四种蝇随时间生存的计数数据,物种,性别,密度和日(我每5天重复一次我的存活计数)作为不同的因素。

我的代码如下所示:

survival <- cbind(Dead,Alive)
model1 <- glm (survival ~ Species*density*Sex*day,
      data = DataM5, family = quasibinomial)
car::Anova(model1, Type = "III")
plot(model1)

我的QQ情节有很重的尾巴,我的残差与合适的情节看起来非常偏向右边。我理解这意味着我的方差不是正常分布的(请原谅我,如果我没有这个权利,我正在努力去理解统计数据但是尽我所能),如果是这样的话,那么我的假设是我的被侵犯了。根据我的阅读,我认为我需要使用泊松分布或负二项分布,但我似乎无法使它们中的任何一个起作用。这是正确的方法吗?如果它是如何让它在R中工作?

QQ Plot

Residual vs Fitted Plot

1 个答案:

答案 0 :(得分:0)

  1. 具有日志链接功能的泊松回归通常用于模拟计数响应
  2. 物种密度性别*日,您包括所有协变量的互动,考虑是否真的有必要。通过使用此模型,您可能会拥有一个过度拟合数据的模型。
  3. 泊松回归是GLM中的一个,但残差并不是正常分布的。