将原始数据叠加到geom_bar上

时间:2013-05-24 05:09:05

标签: r ggplot2

我的数据框安排如下:

condition,treatment,value
A        ,  one    , 2
A        ,  one    , 1
A        ,  two    , 4
A        ,  two    , 2
...
D        ,  two    , 3

我使用ggplot2制作了一个如下所示的分组条形图: example plot

条形按“条件”分组,颜色表示“处理”。条形高度是每个条件/处理对的值的平均值。我通过创建一个新的数据框来实现这一点,该数据框包含构成每个组的所有点的均值和标准误差(对于误差线)。

我想要做的是叠加原始的抖动的数据,以生成此框图的条形图版本:http://docs.ggplot2.org/0.9.3.1/geom_boxplot-6.png [我意识到盒子图可能会更好,但是我的双手被束缚,因为客户在病态上依附于条形图]

我尝试将geom_point对象添加到我的绘图中并将其提供给原始数据(而不是用于制作条形图的聚合方法)。这种方法有效,但它会在错误的x轴位置绘制原始值。它们出现在红色和灰色条连接的点上,而不是在相应条的中心。所以我的情节看起来像这样:

wrong-looking plot

我无法弄清楚如何将点移动固定量然后抖动它们以使它们在正确的条上居中。谁知道?或许,是否有更好的方法来实现我想要做的事情?

以下是显示我遇到的问题的最小示例:

#Make some fake data
ex=data.frame(cond=rep(c('a','b','c','d'),each=8),
    treat=rep(rep(c('one','two'),4),each=4),
    value=rnorm(32) + rep(c(3,1,4,2),each=4) )

#Calculate the mean and SD of each condition/treatment pair
agg=aggregate(value~cond*treat, data=ex, FUN="mean") #mean
agg$sd=aggregate(value~cond*treat, data=ex, FUN="sd")$value #add the SD 


dodge <- position_dodge(width=0.9) 
limits <- aes(ymax=value+sd, ymin=value-sd) #Set up the error bars

p <- ggplot(agg, aes(fill=treat, y=value, x=cond)) 

#Plot, attempting to overlay the raw data
print(
       p + geom_bar(position=dodge, stat="identity") +
       geom_errorbar(limits, position=dodge, width=0.25) + 
       geom_point(data= ex[ex$treat=='one',], colour="green", size=3) +
       geom_point(data= ex[ex$treat=='two',], colour="pink", size=3)
)

3 个答案:

答案 0 :(得分:4)

我发现创建单独的数据帧是不必要的。可以通过向ggplot提供原始数据来创建绘图。

ex <- data.frame(cond=rep(c('a','b','c','d'),each=8),
              treat=rep(rep(c('one','two'),4),each=4),
              value=rnorm(32) + rep(c(3,1,4,2),each=4) )

p <- ggplot(ex, aes(cond,value,fill = treat))
p + geom_bar(position = 'dodge', stat = 'summary', fun.y = 'mean') +
  geom_errorbar(stat = 'summary', position = 'dodge', width = 0.9) +
  geom_point(aes(x = cond), shape = 21, position = position_dodge(width = 1))

ggplot example

答案 1 :(得分:2)

只需拨打一次geom_point()即可使用数据框ex并将x值设为cond,将y值设为value }和color=treat(在aes()内)。然后添加position=dodge以确保点数躲闪。使用scale_color_manual()和参数values=,您可以设置所需的颜色。

p+geom_bar(position=dodge, stat="identity") +
  geom_errorbar(limits, position=dodge, width=0.25)+
  geom_point(data=ex,aes(cond,value,color=treat),position=dodge)+
  scale_color_manual(values=c("green","pink"))

enter image description here

更新 - 点的抖动

您无法一起直接使用职位dodgejitter。但是有一些解决方法。如果将整个绘图保存为对象,则使用ggplot_build()可以看到条形的x位置 - 在这种情况下它们是0.775,1.225,1.775 ......这些位置对应于因子cond和{{的组合1}}。与数据框treat一样,每个组合有4个值,然后添加包含重复4次的x个位置的新列。

ex

现在在ex$xcord<-rep(c(0.775,1.225,1.775,2.225,2.775,3.225,3.775,4.225),each=4) 中,将此新列用作geom_point()值,并将位置设置为x

p + geom_bar(position = dodge,stat =“identity”)+   geom_errorbar(limits,position = dodge,width = 0.25)+   geom_point(data = ex,aes(xcord,value,color = treat),position = position_jitter(width = .15))+   scale_color_manual(值= C( “绿色”, “粉红色”))

enter image description here

答案 2 :(得分:1)

如上面的holmrenser所示,引用单个数据帧并将stat指令更新为&#34; summary&#34;在geom_bar函数中,比创建其他数据帧并将stat指令保留为&#34; identity&#34;更有效。在代码中。

对于抖动,根据OP的原始问题,使用条形图躲避数据点,这也可以通过使用position_jitterdodge更新代码中的位置指令来完成。这种定位方案允许独立定制抖动和闪避术语的宽度,如下所示:

p <- ggplot(ex, aes(cond,value,fill = treat))
p + geom_bar(position = 'dodge', stat = 'summary', fun.y = 'mean') +
geom_errorbar(stat = 'summary', position = 'dodge', width = 0.9) +
geom_point(aes(x = cond), shape = 21, position = 
           position_jitterdodge(jitter.width = 0.5, jitter.height=0.4, 
                                dodge.width=0.9))

enter image description here