如果我想使用共享案例(aka tie)的最低等级对一组数字进行排名:
dat <- c(13,13,14,15,15,15,15,15,15,16,17,22,45,46,112)
rank(dat, ties = 'min')
我得到了结果:
1 1 3 4 4 4 4 4 4 10 11 12 13 14 15
然而,我希望排名是由1,2,3,... n 组成的连续系列,其中 n 是数字独特的排名。
有没有办法让rank
(或类似函数)对一系列数字进行排名,方法是将关联分配给上面的 ,而 的最低排名通过以前与的关系数量跳过后续排名值而不是继续从之前的排名排名?
例如,我希望上面的排名导致:
1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
答案 0 :(得分:4)
你可以用dplyr:
来做library(dplyr)
dense_rank(dat)
[1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
如果您不想加载整个库并在基础r中执行:
r<-rank(dat, na.last = "keep")
match(r, sort(unique(r)))
[1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
答案 1 :(得分:4)
使用factor
,然后将其恢复为numeric
格式:
as.numeric(factor(rank(dat)))
# [1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9