根据dataframe行创建列

时间:2012-05-01 19:55:55

标签: r

我有一个数据框。我正在尝试创建一个虚拟变量,该变量最多为给定行的3列。

for(i in 1:nrow(data))
{
  data[i,]$max_metric <- max(data[i,]$a,
                             data[i,]$b,
                             data[i,]$c)
}

此代码有效,但绝对不是最好的方法。还有其他方法吗?

1 个答案:

答案 0 :(得分:5)

使用pmax,它采用传递给它的所有参数的元素最大值。但是,这意味着您不能只传递整个data.frame。

# this won't work because data[,c("a","b","c")] is one argument
data$max_metric <- pmax(data[,c("a","b","c")])

但您可以通过pmax将data.frame的每一列传递给do.call,因为do.call的第二个参数应该是列表,而data.frames是列表(带有一些属性) )。

data$max_metric <- do.call(pmax, data[,c("a","b","c")])
# if you want na.rm=TRUE
data$max_metric <- do.call(pmax, c(data[,c("a","b","c")],list(na.rm=TRUE)))