如何使用“聚合”对数据进行分组和归类?

时间:2018-10-12 17:07:12

标签: r aggregate missing-data

我需要通过对类别进行分组然后使用第75个百分位数替换缺失值来估算数据。

我找到了聚合函数,让我可以这样做:

GRPAVG = aggregate(INCWAGE ~ AGE + RCE,  data = lps1, mean)

哪怕是卑鄙的人,都做得很好。但是,我无法在这里工作,需要如何在第75个百分位数上进行汇总? IE,我想按“年龄和种族”分组,并在该跨组中找到第75个百分点的数据。

此外,是否有一种方法可以用聚合输出替换其他变量的缺失值?

1 个答案:

答案 0 :(得分:0)

aggregate具有参数FUN(如您所知)。如果将函数传递给此参数,则需要更多的参数,则可以通过...传递它们。如果要计算分位数,则需要传递probs参数。

data("ChickWeight")

head(ChickWeight)
aggregate(weight ~ Chick + Diet, data = ChickWeight,
          FUN = quantile, probs = 0.75)