我需要通过对类别进行分组然后使用第75个百分位数替换缺失值来估算数据。
我找到了聚合函数,让我可以这样做:
GRPAVG = aggregate(INCWAGE ~ AGE + RCE, data = lps1, mean)
哪怕是卑鄙的人,都做得很好。但是,我无法在这里工作,需要如何在第75个百分位数上进行汇总? IE,我想按“年龄和种族”分组,并在该跨组中找到第75个百分点的数据。
此外,是否有一种方法可以用聚合输出替换其他变量的缺失值?
答案 0 :(得分:0)
aggregate
具有参数FUN
(如您所知)。如果将函数传递给此参数,则需要更多的参数,则可以通过...
传递它们。如果要计算分位数,则需要传递probs
参数。
data("ChickWeight")
head(ChickWeight)
aggregate(weight ~ Chick + Diet, data = ChickWeight,
FUN = quantile, probs = 0.75)