我有一个数据框d
:
> head(d,20)
groupchange Symscore3
1 4 1
2 4 2
3 4 1
4 4 2
5 5 0
6 5 0
7 5 0
8 4 0
9 2 2
10 5 0
11 5 0
12 5 1
13 5 0
14 4 1
15 5 1
16 1 0
17 4 0
18 1 1
19 5 0
20 4 0
我正在密谋:
ggplot(d, aes(groupchange, y=..count../sum(..count..), fill=Symscore3)) +
geom_bar(position = "dodge")
通过这种方式,每个条形表示其在整个数据上的百分比。
相反,我希望每个条形代表相对百分比;即,groupchange = k
获得的柱的总和应为1
。
答案 0 :(得分:28)
首先总结并转换您的数据:
library(dplyr)
d2 <- d %>%
group_by(groupchange,Symscore3) %>%
summarise(count=n()) %>%
mutate(perc=count/sum(count))
然后你可以绘制它:
ggplot(d2, aes(x = factor(groupchange), y = perc*100, fill = factor(Symscore3))) +
geom_bar(stat="identity", width = 0.7) +
labs(x = "Groupchange", y = "percent", fill = "Symscore") +
theme_minimal(base_size = 14)
这给出了:
或者,您可以使用percent
包中的scales
功能:
brks <- c(0, 0.25, 0.5, 0.75, 1)
ggplot(d2, aes(x = factor(groupchange), y = perc, fill = factor(Symscore3))) +
geom_bar(stat="identity", width = 0.7) +
scale_y_continuous(breaks = brks, labels = scales::percent(brks)) +
labs(x = "Groupchange", y = NULL, fill = "Symscore") +
theme_minimal(base_size = 14)
给出:
答案 1 :(得分:11)
如果您的目标是使用最小代码进行可视化,请使用 position = "fill"
作为geom_bar()
中的参数。
如果你想在群体百分比内,@ Jaap的dplyr
回答答案是可行的方法。
以下是使用上述数据集进行复制/粘贴的可重现示例:
library(tidyverse)
d <- data_frame(groupchange = c(4,4,4,4,5,5,5,4,2,5,5,5,5,4,5,1,4,1,5,4),
Symscore3 = c(1,2,1,2,0,0,0,0,2,0,0,1,0,1,1,0,0,1,1,0))
ggplot(d, aes(x = factor(groupchange), fill = factor(Symscore3))) +
geom_bar(position="fill")