我正在努力制作一个变量在ggplot中的一个因子的比例图。
以mtcars
数据为例,从this question窃取部分解决方案我可以提出
ggplot(mtcars, aes(x = as.factor(cyl))) +
geom_bar(aes(y = (..count..)/sum(..count..))) +
scale_y_continuous(labels = percent_format())
此图表显示整个数据集中每个cyl
类别的比例。
我想得到的是每个cyl
类别中具有自动传输(二进制变量am
)的汽车比例。
在每个栏的顶部,我想为比例添加一个错误栏。
是否可以仅使用ggplot
执行此操作?或者我是否必须首先使用摘要准备数据框并将其与条形图的identity
选项一起使用?
我在Cookbook for R网页上找到了一些示例,但它们处理的是连续的y变量。
答案 0 :(得分:6)
我认为制作新数据框然后将其用于绘图会更容易。在这里,我计算了比例和下限/上限置信区间值(从prop.test()
结果中获取)。
library(plyr)
mt.new<-ddply(mtcars,.(cyl),summarise,
prop=sum(am)/length(am),
low=prop.test(sum(am),length(am))$conf.int[1],
upper=prop.test(sum(am),length(am))$conf.int[2])
ggplot(mt.new,aes(as.factor(cyl),y=prop,ymin=low,ymax=upper))+
geom_bar(stat="identity")+
geom_errorbar()