R中的增长曲线分析-两条增长曲线的比较

时间:2018-08-07 07:18:05

标签: r statistics anova manova

我有一个小任务要做,很遗憾,我对统计领域并不了解...实际上我确实需要计算(我不是在寻找现成的解决方案),但是我不知道它们是否重新纠正,也要纠正我的思维方式,因此,如果您看看并指出我的错误,我将不胜感激。

以下是虚假数据,显示了猫和猫的增长率(总计):

time <- c(1,2,3,4,5,6,7,8,9,10,1,2,3,4,5,6,7,8,9,10)
a <- rep('dog', 10)
b <- rep('cat', 10)
animal <- c(a,b)
val <- c(2.00,8.00,17.00,21.00,29.00,37.00,41.00,56.00,67.00,82.00,1.00,3.00,6.00,8.00,11.00,15.00,21.00,26.00,31.00,37.00)
data <- data.frame(time,animal,val)

仔细看看:

require(ggplot2)
ggplot(data, aes(time, val, color=animal)) +
  stat_summary(fun.data=mean_se, geom="pointrange") +
  geom_point()

enter image description here

您看到狗比猫长得快-这可能是我的假设。但是我需要做一些统计才能证明这一点。

因此,我决定执行增长曲线分析(GCA)。 我基于this教程。在我的结果下方,有简要说明。

所以首先我建立了一个基本模型,对每只动物进行随机拦截:

m.base <- lmer(val ~ time + (1 | animal), data=data, REML = F)

这里有问题,实际上我在这里没有任何固定的影响,我的数据集很简单,我只想知道我的时间增长率两组(狗和猫)在统计学上均具有显着差异。 换一种说法。 在这段时间内动物的生长速度是否不同?

因此,我将动物作为附加的固定效果:

m.1 <- lmer(val ~ time * animal + (1 | animal), data=data, REML = F)

现在,要检查是否存在统计学上的显着差异,我使用ANOVA比较了两个模型。

    > anova(m.base,m.1)
Data: data
Models:
m.base: val ~ time + (1 | animal)
m.1: val ~ time * animal + (1 | animal)
       Df    AIC    BIC  logLik deviance  Chisq Chi Df Pr(>Chisq)    
m.base  4 151.43 155.41 -71.714   143.43                             
m.1     6 116.29 122.26 -52.145   104.29 39.138      2  3.171e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

现在我很困惑,我不完全理解所有这些分析,有几个问题...

该值 3.171e-09 表明我的组的增长率存在统计学差异吗?

我是否可以制作另一个模型:

m.0 <- lmer(val ~ time + animal + (1 | animal), data=data, REML = F)

然后执行模型测试?

> anova(m.base,m.0,m.1)
Data: data
Models:
m.base: val ~ time + (1 | animal)
m.0: val ~ time + animal + (1 | animal)
m.1: val ~ time * animal + (1 | animal)
       Df    AIC    BIC  logLik deviance   Chisq Chi Df Pr(>Chisq)    
m.base  4 151.43 155.41 -71.714   143.43                              
m.0     5 145.58 150.56 -67.789   135.58  7.8499      1   0.005082 ** 
m.1     6 116.29 122.26 -52.145   104.29 31.2884      1  2.224e-08 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

哪个值可以让我确认自己的假设?

我将非常感谢ponint的错误,任何线索和解释!

1 个答案:

答案 0 :(得分:3)

我假设每个数据点都来自不同的动物。如果只有两个动物的数据,则只能比较这两个动物,而不能推断出这两个种群的任何信息。如果您有几只动物的数据,但每只动物都是重复测量的,则确实需要一个混合效应模型。但是根据我上面的假设,您不需要它。

您现在可以使用特定领域理论中的参数模型,并使用nlme::gnls。该函数基本上适合非线性模型,其中参数是某些其他变量(在您的情况下是动物的类型)的线性模型。然后可以测试这些线性模型的参数的重要性,summary方法会为您完成这些测试。如果您有重复测量的方法,nlme::nlme会将其扩展到混合效果模型。

另一种方法是非参数模型:

library(mgcv)
mod1 <- gam(val ~ s(time, k = 4), data = data, select = TRUE)
mod2 <- gam(val ~ animal + s(time, k = 4, by = animal), data = data, select = TRUE)
#we need the parametric effect because smoothers are centered

#compare both models, not sure which test is more appropriate, 
#let's just do both Chisq and F
anova(mod1, mod2, test = "Chisq")
anova(mod1, mod2, test = "F")
#significant difference between animal types
#plots show which one grows faster
gam.check(mod2)
plot(mod2)
summary(mod2)

如有必要,还可以扩展到混合效果模型。