使用均值函数整理数据框中的列

时间:2019-05-06 11:50:10

标签: r dataframe mean tidy

我每个年度和每个季度都有以下失业数据,但在我的数据框架中,该数据截至2018年,但我仅以两年为例。

Year       Unemployement

1997Q3       1914 
1997Q4       1697 
1998Q1       1702 
1998Q2       1645 
1998Q3       1742 
1998Q4       1605

我可以使用什么代码整理“年份”列并获得以下数据,并且主要通过计算每年每项数据的平均值来获得失业人数:1997和1998(对于我拥有的其他年份,则为+在我的数据框中)。在最终版本中,我只希望每年有一个失业数据,理论上应该是所有Quaters的平均值

Year       Unemployement

1997         1805.50

1998         1673.50 

谢谢!

1 个答案:

答案 0 :(得分:0)

##Data entry

library(tidyverse)

df<- tribble(
~Year,~Quarter,~Unemployement,
1997,"Q3",1914,
1997,"Q4",1697,
1998,"Q1",1702,
1998,"Q2",1645,
1998,"Q3",1742,
1998,"Q4",1605
)


##Solution

df%>%
group_by(Year)%>%
summarise(mean_year = mean(Unemployement))


# A tibble: 2 x 2
   Year mean_year
  <dbl>     <dbl>
1  1997     1806.
2  1998     1674.

## 2nd Version (first separate the Year-column)

df%>%
  separate(Year, c("Year", "Quarter"))%>%
  group_by(Year)%>%
  summarise(mean_year = mean(Unemployement))