根据另一列的排名将列添加到R中的数据框

时间:2016-10-12 19:52:00

标签: r dataframe

以下是我的数据的可重现示例。对于以下数据框:

df <- data.frame(Subject = c('John', 'John', 'John', 'John','Mary', 'Mary', 'Mary', 'Mary'),
                 SNR = c(-4,-4,0,4,0,4,4,8))

我想添加一个列'rank',它按主题提供SNR的排名,所以它看起来像这样:

Subject   SNR   Rank
John      -4    1
John      -4    1
John       0    2
John       4    3
Mary       0    1
Mary       4    2
Mary       4    2
Mary       8    3

我尝试过使用:

dfNew <- transform(df, Rank = ave(SNR, Subject, FUN = function(x) rank(x, ties.method = "first")))

但我得到以下内容:

Subject   SNR   Rank
John      -4    1
John      -4    2
John       0    3
John       4    4
Mary       0    1
Mary       4    2
Mary       4    3
Mary       8    4   

我也尝试过使用不同的ties.method选项,但是没有一个能给我我想要的东西(即排名只有1-3)。

任何帮助将不胜感激!

4 个答案:

答案 0 :(得分:2)

在基地R中使用aggregatefactor

ag <- aggregate(SNR~Subject, df, function(x) as.numeric(factor(x)))
df$rank <- c(t(ag[,-1]))

  Subject SNR rank
1    John  -4    1
2    John  -4    1
3    John   0    2
4    John   4    3
5    Mary   0    1
6    Mary   4    2
7    Mary   4    2
8    Mary   8    3

答案 1 :(得分:2)

另一种基本R方法:

transform(df1, Rank = ave(SNR, Subject, FUN = function(x) cumsum(c(TRUE, head(x, -1) != tail(x, -1)))))

给出:

  Subject SNR Rank
1    John  -4    1
2    John  -4    1
3    John   0    2
4    John   4    3
5    Mary   0    1
6    Mary   4    2
7    Mary   4    2
8    Mary   8    3

如果您的数据框尚未订购,则应首先使用df1 <- df1[order(df1$SNR),]为此方法订购,以便提供正确的结果。

答案 2 :(得分:1)

有点脏,但似乎有效:

library(dplyr)
df %>% group_by(Subject) %>% mutate(Rank = as.numeric(as.factor(SNR))) 

  Subject   SNR  Rank
   <fctr> <dbl> <dbl>
1    John    -4     1
2    John    -4     1
3    John     0     2
4    John     4     3
5    Mary     0     1
6    Mary     4     2
7    Mary     4     2
8    Mary     8     3

答案 3 :(得分:1)

break

当然可以归功于@ rich-scriven提及library(dplyr) df %>% arrange(Subject, SNR) %>% group_by(Subject) %>% mutate(rank=dense_rank(SNR))