我有爱尔兰的失业率数据集。我想进行分组,并汇总数据集。例如......
Period Percent
2019Apr 5
2019Mar 4
2019Feb 4
2019Jan 3
2018Dec 2
2018NOV 4
我想要这样的输出:
Period Percent
2019 4.3 (Average of 2019Apr, 2019Mar....)
2018 3
2017 4
这是针对R编程语言的。我尝试了子集和按功能分组和汇总。
我希望这样的输出:
Period Percent
2019 4.3 (Average of 2019Apr, 2019Mar....)
2018 3
2017 4
答案 0 :(得分:1)
由于您不需要它们,因此我会先从一年中删除它们。然后,我将它们分组并计算平均值。我创建了以下示例:
library(dplyr)
df1 <- data.frame("Period" = c("2019NOV", "2019DEC", "2019OCT", "2018DEC", "2018NOV"), "Percent" = c(1:5))
df1$Period <- sub("^(\\d{4}).*$", "\\1", df1$Period)
df1 <- df1 %>%
group_by(Period) %>%
summarize(Percent = mean(Percent))