如何在R data.table中检索行中最大值的列?

时间:2017-07-17 16:21:31

标签: r dataframe data.table max

我有以下R data.table:

library(data.table)
iris = as.data.table(iris)
> iris
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1            5.1         3.5          1.4         0.2     setosa
2            4.9         3.0          1.4         0.2     setosa
3            4.7         3.2          1.3         0.2     setosa
4            4.6         3.1          1.5         0.2     setosa
5            5.0         3.6          1.4         0.2     setosa
6            5.4         3.9          1.7         0.4     setosa
7            4.6         3.4          1.4         0.3     setosa
8            5.0         3.4          1.5         0.2     setosa
...

我想说我希望每行找到行的最大值,仅针对data.table列的子集:Sepal.LengthSepal.WidthPetal.LengthPetal.Width

我会使用以下代码:

iris[, maximum_element :=max(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width), by=1:nrow(iris)]

哪个输出

     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species     maximum_element
  1:          5.1         3.5          1.4         0.2    setosa               5.1
  2:          4.9         3.0          1.4         0.2    setosa               4.9
  3:          4.7         3.2          1.3         0.2    setosa               4.7
  4:          4.6         3.1          1.5         0.2    setosa               4.6
  5:          5.0         3.6          1.4         0.2    setosa               5.0

对于我的问题,我实际上对该值不感兴趣,但该值来自哪一列,即我想要以下输出:

     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species maximum_column
      1:          5.1         3.5          1.4         0.2    setosa  Sepal.Length
      2:          4.9         3.0          1.4         0.2    setosa  Sepal.Length
      3:          4.7         3.2          1.3         0.2    setosa  Sepal.Length
      4:          4.6         3.1          1.5         0.2    setosa  Sepal.Length
      5:          5.0         3.6          1.4         0.2    setosa  Sepal.Length

(在这种情况下,每个最大值来自Sepal.Length)。

我如何"检索"列名是否具有最大值?

1 个答案:

答案 0 :(得分:4)

以下是pmax

的选项
iris[, maximum_element := do.call(pmax, .SD), .SDcols = 1:4]

要查找列名,请在将max.col指定为数字列后使用.SD上的.SDcols,即第1列到第4列

iris[,maximum_column :=  names(.SD)[max.col(.SD)], .SDcols = 1:4]
head(iris, 4)
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species maximum_column
#1:          5.1         3.5          1.4         0.2  setosa   Sepal.Length
#2:          4.9         3.0          1.4         0.2  setosa   Sepal.Length
#3:          4.7         3.2          1.3         0.2  setosa   Sepal.Length
#4:          4.6         3.1          1.5         0.2  setosa   Sepal.Length