当geom_text不合适时,如何在ggplot中放置百分比标签?

时间:2013-08-20 10:16:55

标签: r ggplot2 bar-chart

以下是我的简化数据:

company <-c(rep(c(rep("company1",4),rep("company2",4),rep("company3",4)),3))
product<-c(rep(c(rep(c("product1","product2","product3","product4"),3)),3))
week<-c( c(rep("w1",12),rep("w2",12),rep("w3",12)))

mydata<-data.frame(company=company,product=product,week=week)
mydata$rank<-c(rep(c(1,3,2,3,2,1,3,2,3,2,1,1),3))
mydata=mydata[mydata$company=="company1",]

并且,我使用的R代码:

ggplot(mydata,aes(x = week,fill = as.factor(rank))) +
geom_bar(position = "fill")+
scale_y_continuous(labels = percent_format())

在条形图中,我想按星级标记百分比。 问题在于数据没有排名百分比。并且该数据的结构不适合具有一个。 (当然,原始数据比示例有更多的观察结果)

是否有人可以教我如何标记此图表中的百分比?

1 个答案:

答案 0 :(得分:17)

我不确定我理解为什么geom_text不合适。这是一个使用它的答案,但如果你指出它为什么不合适,也许有人可能会想出你正在寻找的答案。

library(ggplot2)
library(plyr)

mydata = mydata[,c(3,4)] #drop unnecessary variables
data.m = melt(table(mydata)) #get counts and melt it

#calculate percentage:
m1 = ddply(data.m, .(week), summarize, ratio=value/sum(value)) 

#order data frame (needed to comply with percentage column):
m2 = data.m[order(data.m$week),]

#combine them:
mydf = data.frame(m2,ratio=m1$ratio)

这为我们提供了以下数据结构。 ratio列包含指定rank内给定week的相对频率(因此可以看出rank == 3的数量是其他两个的两倍)。

> mydf
  week rank value ratio
1   w1    1     1  0.25
4   w1    2     1  0.25
7   w1    3     2  0.50
2   w2    1     1  0.25
5   w2    2     1  0.25
8   w2    3     2  0.50
3   w3    1     1  0.25
6   w3    2     1  0.25
9   w3    3     2  0.50

接下来,我们必须计算百分比标签的位置并绘制它。

#get positions of percentage labels:
mydf = ddply(mydf, .(week), transform, position = cumsum(value) - 0.5*value) 

#make plot
p =
ggplot(mydf,aes(x = week, y = value, fill = as.factor(rank))) +
  geom_bar(stat = "identity")

#add percentage labels using positions defined previously
p + geom_text(aes(label = sprintf("%1.2f%%", 100*ratio), y = position))

这是你想要的吗?

enter image description here