我想制作一个看起来像这样的图形:
我的原始数据集如下所示:
> bb[sample(nrow(bb), 20), ]
IMG QUANT FIX
25663 1 1 0
7936 2 2 0
23586 3 2 0
23017 2 2 1
31363 1 3 1
7886 2 2 0
23819 3 3 1
29838 2 2 1
8169 2 3 1
9870 2 3 0
31440 2 1 0
35564 3 1 0
24066 1 2 0
12020 3 2 0
6742 3 2 0
6189 2 3 0
26692 2 3 0
1387 3 2 0
31839 2 3 1
28637 3 2 0
因此,我们的想法是条形显示每个因素FIX = 1
和每个QUANT
的位置
因素IMG
。
我使用plyr
library(plyr)
bb.perc <- ddply(bb,.(QUANT,IMG),summarise,FIX.PROP = sum(FIX) / length(FIX))
几乎正确的事情:
QUANT IMG FIX.PROP
1 1 1 0.52439024
2 1 2 0.19085366
3 1 3 0.13658537
4 2 1 0.20414201
5 2 2 0.53964497
6 2 3 0.09585799
7 3 1 0.29000000
8 3 2 0.13000000
9 3 3 0.40705882
但是现在如果我制作一个图表,它不会考虑FIX==0
个案例,即所有栏都有相同的高度,即100%,这不是我想要的。请注意各个QUANT子帧的总和不是100%:
> sum(bb.perc[1:3,]$FIX.PROP)
[1] 0.8518293
> sum(bb.perc[4:6,]$FIX.PROP)
[1] 0.839645
> sum(bb.perc[7:9,]$FIX.PROP)
[1] 0.8270588
我能用R做的最好就是显示计数:
# Take only the positive samples
bb.pos <- bb[bb$FIX == 1,]
# Plot the counts
ggplot(bb,aes(factor(QUANT),fill=factor(IMG))) + geom_bar() +
scale_y_continuous(labels=percent)
结果是: 这也不是我想要的:
percent
功能,但我不知道如何。在SO上已经有很多类似的问题,但我似乎缺乏 推断足够的智力(或理解R) 从他们到我特定问题的解决方案。
感谢您的任何指示!
编辑:Sven Hohenstein已经提供了一个答案,但这也是我自己最终做到的方式:> ggplot(bb.perc,aes(x=factor(QUANT),y=FIX.PROP,label=paste(round(FIX.PROP*100),
"%"),fill=factor(IMG)))+ geom_bar(stat="identity") + geom_text(position="stack",
aes(ymax=1),vjust=5) + scale_y_continuous(labels = percent)
使用bb.perc
我使用plyr
进一步定义的position = "fill"
。这个有
百分比是按列本地计算的优点,而不是
全局。
感谢大家的帮助。以下两个问题及其各自的问题 答案帮助我做得很好:
Stacked Bar Graph Labels with ggplot2
Adding labels to ggplot bar chart
我最初做错了,是将geom_bar()
参数传递给了
{{1}},由于某种原因,所有的酒吧都有相同的高度!
答案 0 :(得分:22)
这是一种生成情节的方法:
ggplot(bb[bb$FIX == 1, ],aes(x = factor(QUANT), fill = factor(IMG),
y = (..count..)/sum(..count..))) +
geom_bar() +
stat_bin(geom = "text",
aes(label = paste(round((..count..)/sum(..count..)*100), "%")),
vjust = 5) +
scale_y_continuous(labels = percent)
更改vjust
参数的值以调整标签的垂直位置。