我有以下数据:
set.seed(15)
ddf <- data.frame(
gp1 = sample(1:3, 200, replace=T),
gp2 = sample(c('a','b'), 200, replace=T),
param = sample(10:20, 200, replace=T)
)
head(ddf)
gp1 gp2 param
1 2 a 18
2 1 b 11
3 3 a 15
4 2 b 20
5 2 a 17
6 3 b 11
我必须创建另一个名为&#39; category&#39;的列。如果&#39; param&#39;那么它需要值为1该行的gp1和gp2超过75%。
我试过以下但我不确定这是否正确:
ddf$category = with(ddf, ifelse(param>quantile(ddf[ddf$gp1==gp1 & ddf$gp2==gp2,]$param, .75, na.rm=T), 1, 0) )
上面的代码是否正确,否则怎么办呢?谢谢你的帮助。
答案 0 :(得分:2)
(将“value”改为“param”后)
ddf = data.frame(gp1, gp2, param)
ddf$category <- with(ddf, ave(param, gp1,gp2,
FUN=function(x) x > quantile(x,.95) ) )
> ddf
gp1 gp2 param category
1 2 a 20 0
2 2 a 16 0
3 1 a 12 0
4 1 b 16 0
5 3 b 19 0
snipped
> sum(ddf$category)
[1] 2