R-找出包含一行最大值的列是否与另一列绑定

时间:2019-07-19 15:01:07

标签: r

我有一些带有几列整数的数据:

df <- data.frame(v1 = c(0,2,5,6,9,8,7,4,5,6,3,5,4),
                 v2 = c(6,3,5,4,9,5,7,4,8,5,2,3,6),
                 v3 = c(9,6,3,5,4,2,8,7,4,1,2,5,4),
                 v4 = c(6,3,5,2,1,4,1,2,5,3,2,1,2),
                 v5 = c(6,3,2,5,4,1,2,5,3,2,5,6,5))

我正在使用which.max查找具有最大值的列:

df$top <- colnames(df)[apply(df,1,which.max)]

返回:

   v1 v2 v3 v4 v5 top
1   0  6  9  6  6  v3
2   2  3  6  3  3  v3
3   5  5  3  5  2  v1
4   6  4  5  2  5  v1
5   9  9  4  1  4  v1
6   8  5  2  4  1  v1
7   7  7  8  1  2  v3
8   4  4  7  2  5  v3
9   5  8  4  5  3  v2
10  6  5  1  3  2  v1
11  3  2  2  2  5  v5
12  5  3  5  1  6  v5
13  4  6  4  2  5  v2

因为这仅返回具有第一个最大值的列名,所以我需要找到一种方法来创建包含TRUE或FALSE的另一列,其中最大值与该列值绑定,如下所示:

   v1 v2 v3 v4 v5 top tie
1   0  6  9  6  6  v3 FALSE
2   2  3  6  3  3  v3 FALSE
3   5  5  3  5  2  v1 TRUE
4   6  4  5  2  5  v1 FALSE
5   9  9  4  1  4  v1 TRUE
6   8  5  2  4  1  v1 FALSE
7   7  7  8  1  2  v3 FALSE
8   4  4  7  2  5  v3 FALSE
9   5  8  4  5  3  v2 FALSE
10  6  5  1  3  2  v1 FALSE
11  3  2  2  2  5  v5 FALSE
12  5  3  5  1  6  v5 FALSE
13  4  6  4  2  5  v2 FALSE

有一种简单的方法吗?

3 个答案:

答案 0 :(得分:4)

一种选择是获取max并按行检查max元素的数量

df$tie <- apply(df[1:5], 1, function(x) sum(x == max(x)) > 1)
df$tie
#[1] FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

或使用rowSums

rowSums(df[1:5] == do.call(pmax, df[1:5])) > 1
#[1] FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

注意:两种方法都是通用的,可以满足多种条件

答案 1 :(得分:3)

我们可以使用max.col来利用ties.method

df$tie <- !max.col(df, ties.method = "first") == max.col(df, ties.method = "last")


df
#   v1 v2 v3 v4 v5   tie
#1   0  6  9  6  6 FALSE
#2   2  3  6  3  3 FALSE
#3   5  5  3  5  2  TRUE
#4   6  4  5  2  5 FALSE
#5   9  9  4  1  4  TRUE
#6   8  5  2  4  1 FALSE
#7   7  7  8  1  2 FALSE
#8   4  4  7  2  5 FALSE
#9   5  8  4  5  3 FALSE
#10  6  5  1  3  2 FALSE
#11  3  2  2  2  5 FALSE
#12  5  3  5  1  6 FALSE
#13  4  6  4  2  5 FALSE

答案 2 :(得分:1)

您可以

df['tie']=rowSums(df[1:5]==apply(df,1,max))>1
df
   v1 v2 v3 v4 v5   tie top
1   0  6  9  6  6 FALSE  v3
2   2  3  6  3  3 FALSE  v3
3   5  5  3  5  2  TRUE  v1
4   6  4  5  2  5 FALSE  v1
5   9  9  4  1  4  TRUE  v1
6   8  5  2  4  1 FALSE  v1
7   7  7  8  1  2 FALSE  v3
8   4  4  7  2  5 FALSE  v3
9   5  8  4  5  3 FALSE  v2
10  6  5  1  3  2 FALSE  v1
11  3  2  2  2  5 FALSE  v5
12  5  3  5  1  6 FALSE  v5
13  4  6  4  2  5 FALSE  v2