我正在尝试使用下面的代码来累积我的累积区域图,该代码基于http://dantalus.github.io/2015/08/16/step-plots/。我添加了position=stack
,但情节仍然重叠。
我想要实现的目标是在一定时期内显示每年的累计出版物数量。因此,作为一个例子,在1940年可能会有一个出版物,第二年可能会有2个出版物,累计总数达到3个。
将这些区域叠加在一起的最佳方法是什么?
如何控制订单?我是否需要使用arrange()
订购TERM2?
ggplot(data=working, aes(x=Year, color=TERM2, fill=TERM2)) +
stat_bin(data = subset(working, TERM2=="A"), bins=80, aes(y=cumsum(..count..)),geom="area", position="stack", alpha=0.1) +
stat_bin(data = subset(working, TERM2=="B"), bins=80, aes(y=cumsum(..count..)),geom="area", position="stack",alpha=0.1) +
stat_bin(data = subset(working, TERM2=="Both"),bins=80, aes(y=cumsum(..count..)),geom="area", position="stack", alpha=0.1) +
ylab("Total Number") + xlim(1940,2020) + ggtitle("Cumulative number by measurement method")
我目前得到的内容:
我想要实现的例子:
以下图表是使用相同的数据在Excel中创建的,这正是我希望在R中实现的目标。
我的数据:
我的数据当前结构的示例:
Year TERM2
1944 A
1959 B
1966 A
1968 B
1968 A
1970 A
1971 B
1971 B
1971 A
1971 A
1971 Both
1971 Both
1971 Both
1972 A
1972 Both
1972 Both
1973 B
1973 A
1974 A
1974 A
'data.frame': 803 obs. of 6 variables:
$ Year : int 1944 1959 1966 1968 1968 1970 1971 1971 1971 1971 ...
$ TERM2 : Factor w/ 3 levels "B","A","Both": 2 1 2 1 2 2 1 1 2 2 ...
根据用户127649的建议进行更改
这是用户127649的建议之后的情节,这与我的预期接近,除了我正在寻找它从0开始到803结束(出版物总数)。
ggplot(data=working, aes(x=Year, color=TERM2, fill=TERM2)) +
stat_bin(bins=80, aes(y=cumsum(..count..)), geom="area", alpha=0.1) +
ylab("Total Number") + xlim(1940,2020) + ggtitle("Cumulative number by measurement method")
答案 0 :(得分:1)
我认为有两个问题。
当您在三个单独的图层中使用Get-Content path/to/file.ext | out-file -encoding ASCII targetFile.ext
时,每个图层都有效地拥有自己独立的数据集。这将给出正确的计数,但(这是一个猜测)我认为在三个单独的层中意味着你不能堆叠它们。
如果您对所有图层使用stat_bin()
,我认为stat_bin()
会对整个数据执行stat = '..count..'
。
我不知道这是否是最佳方法,但我认为这是你所追求的。
数据强>
数据已分组,每个组分别使用cumsum()
。
cumsum()
<强>剧情强>
此代码将生成下面的第一个图。如果您更喜欢第二个图的外观,则可以取消注释数据操作块的最后一行。
library(tidyverse)
working <- working %>%
count(Year, TERM2) %>%
spread(TERM2, n, fill = 0) %>%
mutate_at(vars('A', 'B', 'Both'), cumsum) %>%
gather(TERM2, N, -Year, factor_key = T) #%>%
# mutate(TERM2 = ordered(TERM2, levels = rev(levels(TERM2))))
<强>结果强>