R新手在这里。 我正在做一个项目,我需要将多年的数据合并到每个列的单个摘要统计中。例如,我有五年需要平均的数据,其中有几列用于不同的变量。 现代潜水工作中提供的示例:
summary_monthly_temp <- weather %>%
group_by(month) %>%
summarize(mean = mean(temp, na.rm = TRUE),
std_dev = sd(temp, na.rm = TRUE)
)
summary_monthly_temp
然后我对其进行了修改以满足自己的需求:
summarysummary<- filename%>%
group_by(country) %>%
summarize(mean = mean(gdp, na.rm = TRUE),
std_dev = sd(gdp, na.rm = TRUE)
)
但是在summary函数中,我需要总结一些变量,例如人口(获取平均人口)和总gdp。
最好的方法是什么?
我尝试了类似的方法,但是它不起作用:
summary<- filename%>%
group_by(country) %>%
summarize(mean = mean(gdp, na.rm = TRUE),
std_dev = sd(gdp, na.rm = TRUE))%>%
summarize(mean = mean(pop, na.rm = TRUE),
std_dev = sd(pop, na.rm = TRUE))%>%
我想我知道为什么...将一个功能插入另一个功能...
感谢您的输入!
答案 0 :(得分:0)
首先,最重要的是,应用汇总功能后通常不需要保存数据,因为它的主要用途是在控制台上生成数据汇总作为输出。
现在查看您的代码,我看到一个问题:
filename %>%
group_by(country) %>%
summarize(
mean = mean(gdp, na.rm = TRUE),
std_dev = sd(gdp, na.rm = TRUE)
)
问题似乎出在名为“文件名”的对象上,您需要将其作为R对象显式导入您的工作区中。 本指南应帮助您从本地文件导入数据: https://github.com/rstudio/cheatsheets/raw/master/data-import.pdf
关于汇总的用法,如您的示例所示,您可以有多个输出,我们假设您的数据框具有一个名为“ pop”的变量:
actually_a_dataframe%>%
group_by(country) %>%
summarize(
mean_gdp = mean(gdp, na.rm = TRUE),
std_dev_gdp = sd(gdp, na.rm = TRUE),
mean_pop = mean(pop, na.rm = TRUE),
std_dev_pop = sd(pop, na.rm = TRUE)
)
这将为每个国家/地区产生gdp和pop的均值和标准差。