我有一些带有几列整数的数据:
df <- data.frame(v1 = c(0,2,5,6,9,8,7,4,5,6,3,5,4),
v2 = c(6,3,5,4,9,5,7,4,8,5,2,3,6),
v3 = c(9,6,3,5,4,2,8,7,4,1,2,5,4),
v4 = c(6,3,5,2,1,4,1,2,5,3,2,1,2),
v5 = c(6,3,2,5,4,1,2,5,3,2,5,6,5))
我正在使用which.max查找具有最大值的列:
df$top <- colnames(df)[apply(df,1,which.max)]
返回:
v1 v2 v3 v4 v5 top
1 0 6 9 6 6 v3
2 2 3 6 3 3 v3
3 5 5 3 5 2 v1
4 6 4 5 2 5 v1
5 9 9 4 1 4 v1
6 8 5 2 4 1 v1
7 7 7 8 1 2 v3
8 4 4 7 2 5 v3
9 5 8 4 5 3 v2
10 6 5 1 3 2 v1
11 3 2 2 2 5 v5
12 5 3 5 1 6 v5
13 4 6 4 2 5 v2
因为这仅返回具有第一个最大值的列名,所以我需要找到一种方法来创建包含TRUE或FALSE的另一列,其中最大值与该列值绑定,如下所示:
v1 v2 v3 v4 v5 top tie
1 0 6 9 6 6 v3 FALSE
2 2 3 6 3 3 v3 FALSE
3 5 5 3 5 2 v1 TRUE
4 6 4 5 2 5 v1 FALSE
5 9 9 4 1 4 v1 TRUE
6 8 5 2 4 1 v1 FALSE
7 7 7 8 1 2 v3 FALSE
8 4 4 7 2 5 v3 FALSE
9 5 8 4 5 3 v2 FALSE
10 6 5 1 3 2 v1 FALSE
11 3 2 2 2 5 v5 FALSE
12 5 3 5 1 6 v5 FALSE
13 4 6 4 2 5 v2 FALSE
有一种简单的方法吗?
答案 0 :(得分:4)
一种选择是获取max
并按行检查max
元素的数量
df$tie <- apply(df[1:5], 1, function(x) sum(x == max(x)) > 1)
df$tie
#[1] FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
或使用rowSums
rowSums(df[1:5] == do.call(pmax, df[1:5])) > 1
#[1] FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
注意:两种方法都是通用的,可以满足多种条件
答案 1 :(得分:3)
我们可以使用max.col
来利用ties.method
df$tie <- !max.col(df, ties.method = "first") == max.col(df, ties.method = "last")
df
# v1 v2 v3 v4 v5 tie
#1 0 6 9 6 6 FALSE
#2 2 3 6 3 3 FALSE
#3 5 5 3 5 2 TRUE
#4 6 4 5 2 5 FALSE
#5 9 9 4 1 4 TRUE
#6 8 5 2 4 1 FALSE
#7 7 7 8 1 2 FALSE
#8 4 4 7 2 5 FALSE
#9 5 8 4 5 3 FALSE
#10 6 5 1 3 2 FALSE
#11 3 2 2 2 5 FALSE
#12 5 3 5 1 6 FALSE
#13 4 6 4 2 5 FALSE
答案 2 :(得分:1)
您可以
df['tie']=rowSums(df[1:5]==apply(df,1,max))>1
df
v1 v2 v3 v4 v5 tie top
1 0 6 9 6 6 FALSE v3
2 2 3 6 3 3 FALSE v3
3 5 5 3 5 2 TRUE v1
4 6 4 5 2 5 FALSE v1
5 9 9 4 1 4 TRUE v1
6 8 5 2 4 1 FALSE v1
7 7 7 8 1 2 FALSE v3
8 4 4 7 2 5 FALSE v3
9 5 8 4 5 3 FALSE v2
10 6 5 1 3 2 FALSE v1
11 3 2 2 2 5 FALSE v5
12 5 3 5 1 6 FALSE v5
13 4 6 4 2 5 FALSE v2