假设我想在ggplot中的不同年龄组中绘制问题的“是”答案的百分比。这些年龄组显然是因素,但我希望它们以类似比例的方式显示,所以想要使用折线图。
以下是一些数据:
mydata <- data.frame(
age_group = c("young", "middle", "old"),
question = sample(c("yes", "no"), 99, replace = TRUE))
mydata$age_group = factor(mydata$age_group,levels(mydata$age_group)[c(3, 1, 2)])
mydata$question = factor(mydata$question,levels(mydata$question)[c(2,1)])
到目前为止,我一直在使用此代码生成堆积条形图:
ggplot(mydata, aes(age_group, fill = question)) + geom_bar(position = "fill")
我怎样才能将其更改为折线图,仅显示“是”答案的频率计数?答案中的标记表明产生正确输出的解决方法:
但我希望有一种方法可以在一行代码中自动执行此操作,而不是先创建此摘要表。
答案 0 :(得分:5)
如果我理解正确,这可以做你想要的:
ggplot(mydata) +
stat_bin(aes(x=age_group, color=question, group=question), geom="line")
请注意,由于您没有为随机数设置种子,因此看起来并不完全与您的相同。
答案 1 :(得分:1)
如果你只想要&#34;是&#34;的百分比对于每个类别,我建议您将数据更改为以下内容:
question age_group value percent
1 yes young 14 0.4242424
3 yes middle 17 0.5151515
5 yes old 20 0.6060606
使用此代码汇总数据:
library(reshape)
mydata.summary = melt(xtabs(~question+age_group,data=mydata))
mydata.summary2 = mydata.summary[mydata.summary$question=="yes",]
mydata.summary2$percent <- mydata.summary2$value/melt(xtabs(~age_group,data=mydata))$value
ggplot(mydata.summary2, aes(age_group,percent, group = question, colour=question)) + geom_line()