我每个年度和每个季度都有以下失业数据,但在我的数据框架中,该数据截至2018年,但我仅以两年为例。
Year Unemployement
1997Q3 1914
1997Q4 1697
1998Q1 1702
1998Q2 1645
1998Q3 1742
1998Q4 1605
我可以使用什么代码整理“年份”列并获得以下数据,并且主要通过计算每年每项数据的平均值来获得失业人数:1997和1998(对于我拥有的其他年份,则为+在我的数据框中)。在最终版本中,我只希望每年有一个失业数据,理论上应该是所有Quaters的平均值
Year Unemployement
1997 1805.50
1998 1673.50
谢谢!
答案 0 :(得分:0)
##Data entry
library(tidyverse)
df<- tribble(
~Year,~Quarter,~Unemployement,
1997,"Q3",1914,
1997,"Q4",1697,
1998,"Q1",1702,
1998,"Q2",1645,
1998,"Q3",1742,
1998,"Q4",1605
)
##Solution
df%>%
group_by(Year)%>%
summarise(mean_year = mean(Unemployement))
# A tibble: 2 x 2
Year mean_year
<dbl> <dbl>
1 1997 1806.
2 1998 1674.
## 2nd Version (first separate the Year-column)
df%>%
separate(Year, c("Year", "Quarter"))%>%
group_by(Year)%>%
summarise(mean_year = mean(Unemployement))