使用dplyr创建排名变量?

时间:2014-09-29 18:25:58

标签: r dplyr

假设我有以下数据

df = data.frame(name=c("A", "B", "C", "D"), score = c(10, 10, 9, 8))

我想在排名中添加一个新列。这就是我正在做的事情:

df %>% mutate(ranking = rank(score, ties.method = 'first'))
#   name score ranking
# 1    A    10       3
# 2    B    10       4
# 3    C     9       2
# 4    D     8       1

但是,我想要的结果是:

#   name score ranking
# 1    A    10       1
# 2    B    10       1
# 3    C     9       2
# 4    D     8       3

显然rank没有做到我的想法。我应该使用什么功能?

2 个答案:

答案 0 :(得分:58)

听起来你正在寻找来自" dplyr"的dense_rank - 但应用的顺序与rank通常的顺序相反。

试试这个:

df %>% mutate(rank = dense_rank(desc(score)))
#   name score rank
# 1    A    10    1
# 2    B    10    1
# 3    C     9    2
# 4    D     8    3

答案 1 :(得分:4)

当您需要将等级应用于所有变量(不仅仅是一个)时的其他解决方案。

df = data.frame(name=c("A","B","C","D"), score=c(10,10,9,8), score2=c(5,1,9,2))

select(df,-name) %>% mutate_all(funs(dense_rank(desc(.))))