我正在尝试按“教育经历年”单元对R中的数据进行分组。我的搜索将我带到dplyr
包中,我可以使用像这样的代码
by_EdExpT <- df1 %>% group_by(ED, EXP, YEAR)
将数据分组。但是我不太确定如何对其执行操作。 dplyr是用于此目的的最佳软件包吗?如何执行均值或回归之类的操作?
答案 0 :(得分:0)
这实际上取决于执行操作的含义。例如,您可以使用summarise()
中的dplyr
函数来按组计算均值。它适用于每组产生一个输出的任何事物。
summarise(by_EdExpT, mean)
如果您想对dplyr
功能进行一些概述,可以使用cheatsheet进行检出。
mutate()
可以将摘要统计信息包含到原始数据中,例如:
iris %>% group_by(Species) %>% mutate(avg = mean(Sepal.Length))
将添加avg
列,该列代表与每一行中的观测值对应的Sepal.Length
的平均值Species
。