从平均值的计算值中分组geom_boxplot

时间:2013-02-26 21:54:03

标签: r ggplot2

我创建了一些分组的箱图,基本上对于x轴上的每个维度,我显示了各种组。因为我的数据集非常大,所以我不得不预先计算框的值,因为ggplot没有足够的内存(我使用ddply并将其分成几部分)。

我认为这不仅仅是平均值的条形图,因为它显示了一些变化。

我想要2个修改,一个是不显示胡须线,我通过设置ymin = lower和ymax = upper来完成。

我也想添加手段,但是它们都显示在每个X类别的中心,当然我希望它们每个都与它的盒子对齐。

为了方便任何人提供帮助,我使用mtcars重新创建了相同的图表 - 我尝试了position = "dodge"和“身份”而没有任何变化

任何人都知道如何做到这一点?我搜索并没有找到方法。我还附上了我最新图表的图片。代码如下

data(mtcars)
data <- as.data.frame(mtcars)
data$cyl <- factor(data$cyl)
data$gear <- factor(data$gear)

summ <- ddply(data, .(cyl, gear),summarize, lower=quantile(mpg,probs=0.25,na.rm=T), middle=quantile(mpg,probs=.5,na.rm=T),upper=quantile(mpg,probs=.75,na.rm=T),avg=mean(mpg,na.rm=T))

p2 <- ggplot(summ, aes(x = cyl, lower = lower, middle = middle, upper = upper,fill=gear,ymin=lower,ymax=upper))+geom_boxplot(stat = "identity")
p2 <- p2 + geom_point(aes(x = cyl, y=avg, color=gear),color="red",position="dodge")
p2 

enter image description here

1 个答案:

答案 0 :(得分:2)

问题是点的宽度与箱形图的宽度不同。在这种情况下,您需要告诉position_dodge使用什么宽度。 ?position_dodge使用点和误差条给出了一个简单的例子,但点和箱形图的原理是相同的。在您的示例中,将position="dodge"替换为position=position_dodge(width=0.9)将使得点数与框图相同。