在R中的另一个函数中使用data.table

时间:2019-01-30 13:48:08

标签: r data.table

使用列创建新变量时,data.table不允许使用带引号的列名称。 在函数中使用data.table时,会产生以下问题。

library(data.table) 
dt <- data.table(var1 = c(1:10), var2 = seq(2,20,2), var3 = seq(40,4,-4))    

addColumnsError <- function(dt, v1, v2){
  dt[,v1 + v2]
}

addColumnsError(dt, var1, var2)
>  Error in eval(jsub, SDenv, parent.frame()) : object 'var1' not found 

addColumnsError(dt, "var1", "var2")
>   Error in v1 + v2 : non-numeric argument to binary operator

以下解决方法可以解决此问题。

addColumns <- function(dt,v1,v2){

  v1<-as.character(substitute(v1))
  v2<-as.character(substitute(v2))

  dt[,eval(parse(text=v1)) + eval(parse(text=v2))]
}

addColumns(dt, var1, var2)
[1]  3  6  9 12 15 18 21 24 27 30
addColumns(dt, "var1", "var2")
[1]  3  6  9 12 15 18 21 24 27 30

是否有更优雅的方法将列名传递给函数中的data.table对象?

(注意:我可以只调用data.table函数,但我打算进行更复杂的计算:))

3 个答案:

答案 0 :(得分:2)

如果要使用非标准评估,则需要substitute之类的东西。但是,绝对没有理由使用parse

addColumnsError <- function(dt, v1, v2){
  eval(substitute(dt[, v1 + v2]))
}

addColumnsError(dt, var1, var2)
#[1]  3  6  9 12 15 18 21 24 27 30

答案 1 :(得分:1)

我认为您正在寻找get()!

library(data.table) 
dt <- data.table(var1 = c(1:10), var2 = seq(2,20,2), var3 = seq(40,4,-4))    

addColumnsError <- function(dt, v1, v2){
  dt[,get(v1) + get(v2)]
}

addColumnsError(dt, "var1", "var2")

最好!

答案 2 :(得分:0)

使用.SDcols(接受字符),您可以执行以下操作:

addColumns <- function(dt, v1, v2){
  dt[, .SD[[1]] + .SD[[2]], .SDcols = c(v1, v2)]
}

# or more elegantly:
addColumns <- function(dt, v1, v2){
  dt[, rowSums(.SD), .SDcols = c(v1, v2)]
}

addColumns(dt, "var1", "var2")
# [1]  3  6  9 12 15 18 21 24 27 30