如何使用ggplot将我的区域图堆叠起来?

时间:2017-08-17 09:11:20

标签: r ggplot2 stacked-area-chart

我正在尝试使用下面的代码来累积我的累积区域图,该代码基于http://dantalus.github.io/2015/08/16/step-plots/。我添加了position=stack,但情节仍然重叠。

我想要实现的目标是在一定时期内显示每年的累计出版物数量。因此,作为一个例子,在1940年可能会有一个出版物,第二年可能会有2个出版物,累计总数达到3个。

将这些区域叠加在一起的最佳方法是什么?

如何控制订单?我是否需要使用arrange()订购TERM2?

ggplot(data=working, aes(x=Year, color=TERM2, fill=TERM2)) +
  stat_bin(data = subset(working, TERM2=="A"), bins=80, aes(y=cumsum(..count..)),geom="area", position="stack", alpha=0.1) +
  stat_bin(data = subset(working, TERM2=="B"), bins=80, aes(y=cumsum(..count..)),geom="area", position="stack",alpha=0.1) +
  stat_bin(data = subset(working, TERM2=="Both"),bins=80, aes(y=cumsum(..count..)),geom="area", position="stack", alpha=0.1) + 
  ylab("Total Number") + xlim(1940,2020) + ggtitle("Cumulative number by measurement method")

我目前得到的内容:

Cumulative Area Plot

我想要实现的例子:

以下图表是使用相同的数据在Excel中创建的,这正是我希望在R中实现的目标。

Excel Example

我的数据:

我的数据当前结构的示例:

 Year TERM2
 1944     A
 1959     B
 1966     A
 1968     B
 1968     A
 1970     A
 1971     B
 1971     B
 1971     A
 1971     A
 1971  Both
 1971  Both
 1971  Both
 1972     A
 1972  Both
 1972  Both
 1973     B
 1973     A
 1974     A
 1974     A

'data.frame':   803 obs. of  6 variables:
 $ Year          : int  1944 1959 1966 1968 1968 1970 1971 1971 1971 1971 ...
 $ TERM2         : Factor w/ 3 levels "B","A","Both": 2 1 2 1 2 2 1 1 2 2 ...

根据用户127649的建议进行更改

这是用户127649的建议之后的情节,这与我的预期接近,除了我正在寻找它从0开始到803结束(出版物总数)。

ggplot(data=working, aes(x=Year, color=TERM2, fill=TERM2)) +
  stat_bin(bins=80, aes(y=cumsum(..count..)), geom="area", alpha=0.1) +
  ylab("Total Number") + xlim(1940,2020) + ggtitle("Cumulative number by measurement method")

after suggestions

1 个答案:

答案 0 :(得分:1)

我认为有两个问题。

  1. 当您在三个单独的图层中使用Get-Content path/to/file.ext | out-file -encoding ASCII targetFile.ext 时,每个图层都有效地拥有自己独立的数据集。这将给出正确的计数,但(这是一个猜测)我认为在三个单独的层中意味着你不能堆叠它们。

  2. 如果您对所有图层使用stat_bin(),我认为stat_bin()会对整个数据执行stat = '..count..'

  3. 我不知道这是否是最佳方法,但我认为这是你所追求的。

    数据

    数据已分组,每个组分别使用cumsum()

    cumsum()

    <强>剧情

    此代码将生成下面的第一个图。如果您更喜欢第二个图的外观,则可以取消注释数据操作块的最后一行。

    library(tidyverse)
    
    working <- working %>% 
         count(Year, TERM2) %>% 
         spread(TERM2, n, fill = 0) %>% 
         mutate_at(vars('A', 'B', 'Both'), cumsum) %>% 
         gather(TERM2, N, -Year, factor_key = T) #%>% 
         # mutate(TERM2 = ordered(TERM2, levels = rev(levels(TERM2))))
    

    <强>结果

    enter image description here