按单元格在R中分组

时间:2018-11-05 23:38:35

标签: r dplyr

我正在尝试按“教育经历年”单元对R中的数据进行分组。我的搜索将我带到dplyr包中,我可以使用像这样的代码

by_EdExpT <- df1 %>% group_by(ED, EXP, YEAR)

将数据分组。但是我不太确定如何对其执行操作。 dplyr是用于此目的的最佳软件包吗?如何执行均值或回归之类的操作?

1 个答案:

答案 0 :(得分:0)

这实际上取决于执行操作的含义。例如,您可以使用summarise()中的dplyr函数来按组计算均值。它适用于每组产生一个输出的任何事物。

summarise(by_EdExpT, mean)

如果您想对dplyr功能进行一些概述,可以使用cheatsheet进行检出。

mutate()可以将摘要统计信息包含到原始数据中,例如:

iris %>% group_by(Species) %>% mutate(avg = mean(Sepal.Length))

将添加avg列,该列代表与每一行中的观测值对应的Sepal.Length的平均值Species