如何使用ggplot为数据框中的每一列创建一个箱形图

时间:2016-06-22 14:09:10

标签: r ggplot2 boxplot

我发现boxplot()会产生以下内容的情节:

  • 上部晶须= min(max(x),Q_3 + 1.5 * IQR)
  • lower whisker = max(min(x),Q_1 - 1.5 * IQR)
  • 上侧= 1四分位
  • middle = mean
  • 底边= 3四分位

我有一个数据框,其头部如下所示:

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

X1H 8 2 0 0 0 2 2 2 6  2  4  2  4  2  4  8  2  6  0 10  0  6  4  0  6  2  8  2  2  8  6  2  2  2  8

X2H 2 0 2 2 2 4 0 4 0  0  2  2  2  2  0  6  2  2  2  0  0  0  2  0  2  4  2  2  2  2  2  2  4  2  0

X3H 0 2 0 0 2 2 0 0 0  4  2  2  2  2  2  0  2  2  0  0  2  0  0  2  2  2  0  6  2  0  2  0  6  0  2

X4H 0 0 0 2 0 2 0 0 2  0  2  0  2  0  0  2  0  6  0  2  2  2  2  0  0  2  4  2  2  2  0  2  4  2  6

X5H 2 0 0 0 2 0 0 2 0  0  2  0  0  2  2  2  0  2  0  2  0  2  0  6  0  2  4  4  0  2  2  0  2  0  4

X6H 2 0 2 0 2 2 0 2 2  0  2  2  2  0  0  2  2  2  0  0  2  0  2  0  0  2  2  2  2  0  2  0  2  2  4

我想有一个每个列显示的箱线图:

  • upper whisker = min
  • lower whisker = max
  • 上侧=平均值+标准差
  • middle = mean
  • 底边=平均值 - 标准差

所以我发现了这个,它就像一个魅力:

min.mean.sd.max <- function(x) {
  r <- c(min(x), mean(x) - sd(x), mean(x), mean(x) + sd(x), max(x))
  names(r) <- c("ymin", "lower", "middle", "upper", "ymax")
  r
}

p1 <- ggplot(aes(y = value, x = factor(group)), data = mydata)

p1 <- p1 + stat_summary(fun.data = min.mean.sd.max, geom = "boxplot")

但在第二种情况下,数据框如下所示:

       value group
1 0.56025153     1
2 0.88368829     1
3 0.06555686     1
4 0.44767630     1
5 0.90424061     2
6 0.96331650     2

所以我不知道在我的情况下将什么放入aes()到ggplot中。

1 个答案:

答案 0 :(得分:0)

我首先创建了一个数据框。

> data
  X X1 X2 X3 X4
X1H  8  2  0  0
X2H  2  0  2  2
X3H  0  2  0  0
X4H  0  0  0  2
X5H  2  0  0  2
X6H  2  0  2  0

然后,使用 melt 函数重新整形。

data.melt<-melt(data, id="X")

鉴于你想用你自己的计算绘制一个箱线图,我为每列计算了 mean,sd,min,max

data.sum<-ddply(data.melt, .(variable), summarise,
         mean = mean(value),
         sd = sd(value),
         min = min(value),
         max = max(value))

然后,您可以使用以下代码为每列创建一个箱线图。

ggplot(data.sum, aes(x=variable))+geom_boxplot(aes(ymin =min, lower = mean-sd, middle = mean, upper = mean+sd, ymax =max), stat="identity")

enter image description here