我想制作一个简单的条形图,我有一个变量x(A,B,C,D)是分类变量,另一个是我要填充的y(是,否),以及一组观测值,我想要显示一个填充的条形图,每列中都带有百分比标签。
像这样简单的事情:
到目前为止,ggplot图层系统一直是使用中的噩梦。在已经提出的问题中我找不到任何解决方案。
x11()
ggplot(data=KS, aes(x=KS$main_category, fill=KS$state)) +
geom_bar(position="fill") +
scale_y_continuous(labels = percent) +
geom_text(aes(label = ..count.., group = KS$state),
stat = "count")
到目前为止,这是我得到的,用于定位的部分显示每个类别和状态的计数,为什么它不能显示比例?并且我要避免操纵数据,并向数据框中添加内容。
非常感谢。
编辑:请求的数据框
library("ggplot2")
library("scales")
main_category=c('A','A','B','C','D','A','A','B','C','D','A','A','B','C','D','A','A','B','C','D')
state=c('Yes', 'No', 'Yes', 'Yes','Yes', 'No', 'Yes', 'Yes','Yes', 'No', 'Yes', 'Yes','Yes', 'No', 'Yes', 'Yes', 'No', 'No', 'No', 'No')
KS = data.frame(main_category, state)
编辑2:
我能够通过使用隐式ggplot变量来找到自己的解决方案而无需操纵数据集:
geom_text(aes( y=..count../tapply(..count.., ..x.. ,sum)[..x..], label=percent(..count../tapply(..count.., ..x.. ,sum)[..x..]) ),
stat="count", position=position_fill(0.5), vjust=0.5)
答案 0 :(得分:1)
鉴于您的数据,请先计算百分比,然后计算相应的y值,并按照您在评论中链接的帖子中的说明进行绘制:
library("ggplot2")
library("scales")
library(dplyr)
main_category=c('A','A','B','C','D','A','A','B','C','D','A','A','B','C','D','A','A','B','C','D')
state=c('Yes', 'No', 'Yes', 'Yes','Yes', 'No', 'Yes', 'Yes','Yes', 'No', 'Yes', 'Yes','Yes', 'No', 'Yes', 'Yes', 'No', 'No', 'No', 'No')
KS = data.frame(main_category, state)
cnt <- KS %>% group_by(main_category, state) %>% summarise(n=n())
pcnt <- do.call(rbind,
lapply(split(cnt, cnt$main_category), function(x){x[x$state=='Yes', 'n']/sum(x$n)})
)
names(pcnt) <- 'pcnt'
pcnt$main_category <- rownames(pcnt)
pcnt$state='Yes'
pcnt2 <- do.call(rbind,
lapply(split(cnt, cnt$main_category), function(x){x[x$state=='No', 'n']/sum(x$n)})
)
names(pcnt2) <- 'pcnt'
pcnt2$main_category <- rownames(pcnt2)
pcnt2$state='No'
KS <- merge(KS, rbind(pcnt, pcnt2))
KS$labelpos <- ifelse(KS$state=='Yes',
KS$pcnt/2, 1 - KS$pcnt/2)
gg <- ggplot(data=KS, aes(x=main_category, fill=state))
gg <- gg + geom_bar(position="fill")
gg <- gg + geom_text(aes(label = paste0(100*pcnt,"%"),y=labelpos),size = 3)
gg <- gg + scale_y_continuous(labels = scales::percent)
print(gg)