R ggplot2中比例的堆积条形图按两个因子的水平分组

时间:2016-07-26 14:01:13

标签: r ggplot2 bar-chart

我有这种格式的数据框:

   types year n_tot n_red n_blue     f_red    f_blue
1      A 2004   441   242    199 0.5487528 0.4512472
2      B 2004   267   147    120 0.5505618 0.4494382
3      C 2004    75    43     32 0.5733333 0.4266667
4      D 2004    48    25     23 0.5208333 0.4791667
5      E 2004    51    27     24 0.5294118 0.4705882
6      A 2008   673   318    355 0.4725111 0.5274889
7      B 2008   270   133    137 0.4925926 0.5074074
8      C 2008    75    38     37 0.5066667 0.4933333
9      D 2008   164    80     84 0.4878049 0.5121951
10     E 2008   164    67     97 0.4085366 0.5914634

这会生成数据帧:

library(dplyr)

types <- LETTERS[1:5]

n_red_2004 <- c(242, 147, 43, 25, 27)
n_tot_2004 <- c(441, 267, 75, 48, 51)

n_red_2008 <- c(318, 133, 38, 80, 67)
n_tot_2008 <- c(673, 270, 75, 164, 164)

df_2004 <- data.frame(types, year = 2004, n_tot = n_tot_2004, n_red = n_red_2004)
df_2008 <- data.frame(types, year = 2008, n_tot = n_tot_2008, n_red = n_red_2008)

df <- rbind(df_2004, df_2008)
df$year <- as.factor(df$year)

df <- mutate(df, n_blue = n_tot - n_red, f_red = n_red/n_tot, f_blue = n_blue/n_tot)

对于每个级别的“类型”,我需要两个条形,每个级别一个 “年”。每个条形图显示红色(n_red)与蓝色的数量 (n_blue)作为类型/年份组合的比例(由数据框中的f_red和f_blue给出)。如何使用ggplot2

执行此操作

1 个答案:

答案 0 :(得分:3)

躲闪和堆叠条的组合无法直接实现(据我所知),所以这里有一个解决方法的想法。

首先,使用包tidyr重新整形数据:

df <- df %>%
  select(-n_tot, -n_red, -n_blue) %>%
  gather(f_group, f_val, f_red:f_blue) %>%
  arrange(types)

然后绘制并使用facet_wrap来实现“躲闪条形图”外观(代码来自this由aosmith回答):

ggplot(df) +
  geom_bar(aes(x = interaction(types, year), y = f_val, fill = f_group), 
           position = "stack", 
           stat = "identity") +
  scale_x_discrete(labels = rep(c(2004, 2008))) +
  facet_wrap(~types, switch = "x", scales = "free_x", nrow = 1) +
  theme(panel.margin = unit(0, "lines"), 
        strip.background = element_blank())

enter image description here