创建平滑线和置信区间的新手问题在ggplot2中形成了lmer模型

时间:2019-12-11 12:49:53

标签: r ggplot2 lme4

很抱歉,这是一个愚蠢的简单问题,但我尝试了所有在网上找到的解决方案,但均无济于事。这也是我在这里的第一篇文章,并且我尝试遵循有关格式的规则。可笑的是,我已经完全实现了我想要的目标,将绘图另存为png,然后几周后返回代码时,它无法正常工作,现在我无法复制已有的内容。

我尝试在此处提供一些示例数据(从该网站借用一些虚构数据–我希望可以)。

tempEf <- data.frame(
  N = rep(c("1", "2","1", "2","1", "2","1"), each=5, times=11),
  Myc = rep(c("1", "2", "3", "4", "5"), each=1, times=77),
  TRTYEAR = runif(385, 1, 15),
  site = rep(c(1:77), each=5, times=1),#77 sites
  Asp = runif(385, 1, 5)
)

# Make up some response data
tempEf$r <- 2*tempEf$TRTYEAR +                   
  -8*as.numeric(tempEf$Myc=="1") +
  4*as.numeric(tempEf$N=="1") +
  0.1*tempEf$TRTYEAR * as.numeric(tempEf$N=="1") +
  0.2*tempEf$TRTYEAR*as.numeric(tempEf$Myc=="1") +
  -11*as.numeric(tempEf$Myc=="1")*as.numeric(tempEf$N=="1")+ 
  0.5*tempEf$TRTYEAR*as.numeric(tempEf$Myc=="1")*as.numeric(tempEf$N=="1")+ 
  as.numeric(tempEf$site) +  #Random intercepts; intercepts will increase by 1
  tempEf$TRTYEAR/10*rnorm(385, mean=0, sd=2)    #Add some noise
#fit model
library(lme4)
model <- lmer(r ~ Myc * N + TRTYEAR + Asp + (1|site), data=tempEf)
tempEf$fit <- predict(model)   #Add model fits to dataframe

我的目标是:

  1. 从lmer模型计算拟合值和95%置信区间

  2. 分别针对我的因变量(r)的2个级别的Myc绘制拟合值(fit),根据Myc进行着色。对于此图,我想忽略N和Asp(在我的实际数据中,这些是控制变量,在模型中很重要,但不重要)

  3. 将我的95%置信区间添加到这两行

所有这一切似乎都很简单,除了它做错了!

我在这里获得了拟合值和95%CI,这使我得到了拟合度,upr和lwr:

predicted_EF<-predictInterval(model, tempEf)

然后将它们添加到我的原始数据框中:

tempEf<-cbind(tempEf,predicted_EF)

然后我这样做:

ggplot(tempEf,aes(TRTYEAR, r, group=Myc, col=Myc )) + 
  geom_line(aes(y=fit, lty=Myc), size=0.8) +
  geom_point(alpha = 0.3) + 
  theme_bw()

这给了我锯齿状的线,如下所示: crappy graph

我可以使用geom_smooth而不是geom_line来产生平滑的线条,但是我相信这是将线条拟合到原始数据,而不是模型拟合值吗?我还可以使用geom_abline为Myc的每个级别拟合单独的回归线(使用fit变量),但也不确定是否正确。

ggplot(tempEf,aes(TRTYEAR, r, group=Myc, col=Myc, fill = Myc)) + 
  geom_smooth(method="lm",se = FALSE)+
  geom_point(alpha = 0.3)+
  theme_bw()

然后尝试使用我的upr和lwr变量添加95%的置信区间会导致锯齿状的置信区:

ggplot(tempEf,aes(TRTYEAR, r, group=Myc, col=Myc, fill = Myc)) + 
  geom_smooth(method="lm",se = FALSE)+
  geom_point(alpha = 0.3) +
  geom_ribbon(alpha=0.1,
              aes(ymin=lwr,ymax=upr,fill = Myc, colour = NA))+
  theme_bw()

如何获得具有平滑置信区间的平滑线?我在做什么错(我可以肯定很多!)。

谢谢您的帮助。

2 个答案:

答案 0 :(得分:1)

我认为这是有效图(或估计的边际均值)的“经典”任务。您可以使用ggeffects-package轻松地做到这一点,网站上有很多示例。

根据您的数据,您只需致电ggpredict(model, c("TRTYEAR", "Myc"))

library(ggeffects)
pred <- ggpredict(model, c("TRTYEAR", "Myc"))
pred
#> 
#> # Predicted values of r
#> # x = TRTYEAR
#> 
#> # Myc = AM
#>   x predicted std.error conf.low conf.high
#>   0     0.797     0.737   -0.647     2.241
#>   2     5.361     0.727    3.936     6.786
#>   6    14.489     0.716   13.085    15.892
#>   8    19.052     0.715   17.652    20.453
#>  10    23.616     0.716   22.213    25.020
#>  16    37.308     0.737   35.863    38.752
#> 
#> # Myc = ECM
#>   x predicted std.error conf.low conf.high
#>   0    -5.575     0.737   -7.019    -4.130
#>   2    -1.011     0.727   -2.436     0.415
#>   6     8.117     0.716    6.713     9.520
#>   8    12.681     0.715   11.280    14.081
#>  10    17.244     0.716   15.841    18.648
#>  16    30.936     0.737   29.492    32.380
#> 
#> Adjusted for:
#> *    N = Nhigh
#> *  Asp =  2.99
#> * site = 0 (population-level)

plot(pred)
#> Loading required namespace: ggplot2

plot(pred, add.data = TRUE)

reprex package(v0.3.0)于2019-12-11创建

答案 1 :(得分:0)

ggeffects软件包看起来超级好,值得一试。为了回答有关为Myc的每个级别分别放置多行的问题,在interaction调用中使用ggplot(aes(group = ))函数始终是一种快速执行此操作的便捷工具。在您的情况下,您包括四个类别变量,其中一个是按颜色编码的。要将其他三个拆分为每个子组(在每个子组下)的直线和功能区:

ggplot(tempEf, aes(TRTYEAR, r, group = interaction(site, N, Myc), col=Myc, fill = Myc)) +
  geom_point(alpha = 0.3) +
  geom_line(aes(y = fit)) +
  geom_ribbon(aes(ymin = lwr, ymax = upr), alpha = 0.1, colour = NA)

给出一组代表每个Myc x site x N分组的线和功能区。我认为您要的是您想要的其他输出(来自ggeffects的输出,但是即使如此,它还是很有帮助的工具:

enter image description here