我正在为右倾斜数据生成箱图,因此使用对数刻度。箱图本身很好,但是如果我通过stat_summary
向箱图添加方法,它们似乎是不正确的。任何洞察我做错的事情都会非常感激。提前谢谢。
下面的可重复示例。问题是显而易见的,如果我们注意到对于B组,平均值超过第3个四分位数,但红点在框内......
set.seed(123)
library(ggplot2)
library(scales)
tmp <- data.frame(x = c(rlnorm(100, 11, 1), rlnorm(100, 10, 2)),
gp = c(rep("A",100), rep("B",100)))
by(tmp$x, tmp$gp, mystat<-function(x){c(mean(x),quantile(x, c(0,.25,.5,.75,1)))})
ggplot(aes(x=gp, y=x), data = tmp) + geom_boxplot() +
stat_summary(fun.y=mean, colour="red", geom="point") +
scale_y_log10(labels = comma)