R dplyr获取name.min rowwise

时间:2016-05-12 20:29:57

标签: r dplyr min

我刚刚使用data.table方法回答this question,并努力提供dplyr等效,但却失败了。

这是一个简单的数据框,其列中包含数值。我想使用dplyr 获取具有最小值的列的名称。

请注意我已经知道解决这个问题的其他方法:目前我唯一感兴趣的是dplyr方法

id <- c(1,2,3,4,5,6,7,8,9,10)
x1 <- c(2,4,5,3,6,4,3,6,7,7)
x2 <- c(0,1,2,6,7,6,0,8,2,2)
x3 <- c(5,3,4,5,8,3,4,2,5,6)

DF <- data.frame(id, x1,x2,x3)

我尝试了几种变体:

DF %>% select(2:4) %>% rowwise() %>% mutate(y = function(x) names(x)[which.min(x)])

DF %>% select(2:4) %>% rowwise() %>% mutate(y = apply(x1:x3, 1, which.min(x1:x3))

但是找不到以dplyr方式执行此操作的方法。我会感激任何提示!

预期产出:

DF
##     id x1 x2 x3  y
##  1:  1  2  0  5 x2
##  2:  2  4  1  3 x2
##  3:  3  5  2  4 x2
##  4:  4  3  6  5 x1
##  5:  5  6  7  8 x1
##  6:  6  4  6  3 x3
##  7:  7  3  0  4 x2
##  8:  8  6  8  2 x3
##  9:  9  7  2  5 x2
## 10: 10  7  2  6 x2

2 个答案:

答案 0 :(得分:3)

这是另一种方法..我没有运行任何基准测试,但我的猜测是它的性能优于使用applyrowwise

DF %>% 
  mutate(y = names(.)[max.col(.[2:4]*-1)+1L])
#    id x1 x2 x3  y
# 1   1  2  0  5 x2
# 2   2  4  1  3 x2
# 3   3  5  2  4 x2
# 4   4  3  6  5 x1
# 5   5  6  7  8 x1
# 6   6  4  6  3 x3
# 7   7  3  0  4 x2
# 8   8  6  8  2 x3
# 9   9  7  2  5 x2
# 10 10  7  2  6 x2

*-1是因为我们想要min而不是max列和+1,因为我们只查看第2列:4但需要正确的列名作为回报。

答案 1 :(得分:2)

这似乎有点(嗯,实际上非常)笨重但是......

DF %>% 
  mutate(y = apply(.[,2:4], 1, function(x) names(x)[which.min(x)]))
   id x1 x2 x3  y
1   1  2  0  5 x2
2   2  4  1  3 x2
3   3  5  2  4 x2
4   4  3  6  5 x1
5   5  6  7  8 x1
6   6  4  6  3 x3
7   7  3  0  4 x2
8   8  6  8  2 x3
9   9  7  2  5 x2
10 10  7  2  6 x2