使用ggplot绘制方差的方差和置信区间

时间:2015-02-16 04:46:57

标签: r ggplot2 statistics data.table variance

考虑标准数据集gear中的变量qsecmtcars

require(ggplot2)
ggplot(mtcars, aes(x=gear, y=qsec)) + geom_point()

enter image description here

我正在尝试使用误差线绘制组内方差(对于每个组)。

这是我当前的解决方案(对错误条使用95%置信区间):

require(data.table)
dtmtcars = data.table(mtcars)[,list(var.qsec = var(qsec)),by=list(gear)]
samplesize = sapply(unique(mtcars$gear), function(x) nrow(subset(mtcars, gear == x)))
high.EB =  ((samplesize-1)*dtmtcars$var.qsec)/qchisq(0.025,n-1)
low.EB = ((samplesize-1)*dtmtcars$var.qsec)/qchisq(0.975,n-1)
ggplot(dtmtcars, aes(x=gear, y=var.qsec)) + geom_point() + geom_errorbar(aes(ymin=low.EB, ymax=high.EB))

enter image description here

是否有更简单的解决方案(如ggplot2中已经实现的功能)?如果没有,请您确认我的解决方案是否正确?

1 个答案:

答案 0 :(得分:2)

使用stat_summary。请注意,当文档fun.data应该"将数据框作为输入"时,文档是错误的。

ggplot(mtcars, aes(x=gear, y=qsec)) + 
  stat_summary(fun.y = var, geom = "point") +
  stat_summary(fun.data = function(y) {
    data.frame(y = var(y),
               ymin = ((length(y)-1)*var(y))/qchisq(0.025,length(y)-1),
               ymax = ((length(y)-1)*var(y))/qchisq(0.975,length(y)-1))
  }, geom = "errorbar") +
  ylab("var.qsec")

resulting plot