如何为多个年份和变量创建汇总统计信息?

时间:2019-11-12 14:38:56

标签: r

R新手在这里。 我正在做一个项目,我需要将多年的数据合并到每个列的单个摘要统计中。例如,我有五年需要平均的数据,其中有几列用于不同的变量。 现代潜水工作中提供的示例:

summary_monthly_temp <- weather %>% 
 group_by(month) %>% 
 summarize(mean = mean(temp, na.rm = TRUE), 
 std_dev = sd(temp, na.rm = TRUE)
 ) 

summary_monthly_temp

然后我对其进行了修改以满足自己的需求:

summarysummary<- filename%>% 
 group_by(country) %>% 
 summarize(mean = mean(gdp, na.rm = TRUE), 
 std_dev = sd(gdp, na.rm = TRUE)
 )

但是在summary函数中,我需要总结一些变量,例如人口(获取平均人口)和总gdp。

最好的方法是什么?

我尝试了类似的方法,但是它不起作用:

summary<- filename%>% 
 group_by(country) %>% 
 summarize(mean = mean(gdp, na.rm = TRUE), 
  std_dev = sd(gdp, na.rm = TRUE))%>%
 summarize(mean = mean(pop, na.rm = TRUE), 
 std_dev = sd(pop, na.rm = TRUE))%>%

我想我知道为什么...将一个功能插入另一个功能...

感谢您的输入!

1 个答案:

答案 0 :(得分:0)

首先,最重要的是,应用汇总功能后通常不需要保存数据,因为它的主要用途是在控制台上生成数据汇总作为输出。

现在查看您的代码,我看到一个问题:

filename %>% 
 group_by(country) %>% 
 summarize(
   mean = mean(gdp, na.rm = TRUE), 
   std_dev = sd(gdp, na.rm = TRUE)
 )

问题似乎出在名为“文件名”的对象上,您需要将其作为R对象显式导入您的工作区中。 本指南应帮助您从本地文件导入数据: https://github.com/rstudio/cheatsheets/raw/master/data-import.pdf

关于汇总的用法,如您的示例所示,您可以有多个输出,我们假设您的数据框具有一个名为“ pop”的变量:

actually_a_dataframe%>% 
 group_by(country) %>% 
 summarize(
   mean_gdp = mean(gdp, na.rm = TRUE), 
   std_dev_gdp = sd(gdp, na.rm = TRUE),
   mean_pop = mean(pop, na.rm = TRUE), 
   std_dev_pop = sd(pop, na.rm = TRUE)
 )

这将为每个国家/地区产生gdp和pop的均值和标准差。