如何在堆叠的条形图(Dplyr)上覆盖折线图?

时间:2019-04-08 20:54:38

标签: r ggplot2 dplyr stacked-chart linegraph

我正在创建一个堆积的条形图,以显示多年来样本方的偏好变化。尽管这部分已经完成,但我想在条形图上绘制折线图,​​以查看与上一年相比发生变化的样本百分比。

我目前已经绘制了两个单独的堆叠条形图,但认为将它们融合在一起会更好。

我的数据如下:

ID   Year   Party  Change
1    2010   Labour  NA
1    2011   Labour  No Change
1    2012   Con     Change
1    2013   Con     No Change
2    2010   Con     No Change
2    2011   Con     No Change
2    2012   Con     No Change
2    2013   Con     No Change
... etc.

这些是我已经绘制的图形。

library(dplyr)
library(ggplot2)

df %>%
  group_by(Change) %>%
  filter(Year != 2010) %>%
  ggplot(aes(fill = Change, y = ID, x= Year)) + 
    geom_bar(stat="identity", position = "fill") +
    xlab("Year") +
    ylab("% of Sample") 

https://imgur.com/lhCoXaR


ggplot(df, aes(fill = PolParty, y = pidp, x = wave)) + 
    geom_bar(stat="identity", position = "fill") +
  xlab("Year") +
  ylab("% of Sample") +

https://imgur.com/0qbIL5h

理想情况下,我想以线形图的形式在第二个图上覆盖第一个图。轴是相同的,所以我不认为这是个问题,但是我不知道如何将堆叠的条形图转换为线形图。

1 个答案:

答案 0 :(得分:1)

有了完整的数据集,我们将得到一个可以更准确反映问题的答案;但是作为一种快速而肮脏的解决方案,您需要使用下面的代码。

我已经更改了名称,以使发生的事情更加清楚。我假设df实际上具有您提到的所有变量。最好将相关变量纠缠到两个单独的数据帧中,然后分别将它们传递给每个geom_

library(dplyr)
library(ggplot2)

data <- "ID   Year   Party  Changed_seats
1    2010   Labour  NA
1    2011   Labour  No_Change
1    2012   Con     Change
1    2013   Con     No_Change
2    2010   Con     No_Change
2    2011   Con     No_Change
2    2012   Con     No_Change
2    2013   Con     No_Change
3    2014   Con     No_Change
3    2015   Con     Change
3    2016   Con     Change
3    2017   Con     No_Change
4    2014   Con     No_Change
4    2015   Con     Change
4    2016   Con     Change
4    2017   Con     No_Change"

df <- read.table(text = data, header = TRUE) 


seat_changes_df <- df %>%
  select(Year, Changed_seats) %>%
  mutate(Year = as.factor(Year)) %>%
  group_by(Year) %>%
  mutate(Prop_change = sum(Changed_seats == "Change")/n())

ggplot() + 
  geom_line(data = seat_changes_df, aes(x = Year, y = Prop_change), group = 1) +
  scale_y_continuous(labels = scales::percent) +
  xlab("Year") +
  ylab("Seats changed")
#> Warning: Removed 2 rows containing missing values (geom_path).