使用列创建新变量时,data.table不允许使用带引号的列名称。 在函数中使用data.table时,会产生以下问题。
library(data.table)
dt <- data.table(var1 = c(1:10), var2 = seq(2,20,2), var3 = seq(40,4,-4))
addColumnsError <- function(dt, v1, v2){
dt[,v1 + v2]
}
addColumnsError(dt, var1, var2)
> Error in eval(jsub, SDenv, parent.frame()) : object 'var1' not found
addColumnsError(dt, "var1", "var2")
> Error in v1 + v2 : non-numeric argument to binary operator
以下解决方法可以解决此问题。
addColumns <- function(dt,v1,v2){
v1<-as.character(substitute(v1))
v2<-as.character(substitute(v2))
dt[,eval(parse(text=v1)) + eval(parse(text=v2))]
}
addColumns(dt, var1, var2)
[1] 3 6 9 12 15 18 21 24 27 30
addColumns(dt, "var1", "var2")
[1] 3 6 9 12 15 18 21 24 27 30
是否有更优雅的方法将列名传递给函数中的data.table对象?
(注意:我可以只调用data.table函数,但我打算进行更复杂的计算:))
答案 0 :(得分:2)
如果要使用非标准评估,则需要substitute
之类的东西。但是,绝对没有理由使用parse
。
addColumnsError <- function(dt, v1, v2){
eval(substitute(dt[, v1 + v2]))
}
addColumnsError(dt, var1, var2)
#[1] 3 6 9 12 15 18 21 24 27 30
答案 1 :(得分:1)
我认为您正在寻找get()!
library(data.table)
dt <- data.table(var1 = c(1:10), var2 = seq(2,20,2), var3 = seq(40,4,-4))
addColumnsError <- function(dt, v1, v2){
dt[,get(v1) + get(v2)]
}
addColumnsError(dt, "var1", "var2")
最好!
答案 2 :(得分:0)
使用.SDcols
(接受字符),您可以执行以下操作:
addColumns <- function(dt, v1, v2){
dt[, .SD[[1]] + .SD[[2]], .SDcols = c(v1, v2)]
}
# or more elegantly:
addColumns <- function(dt, v1, v2){
dt[, rowSums(.SD), .SDcols = c(v1, v2)]
}
addColumns(dt, "var1", "var2")
# [1] 3 6 9 12 15 18 21 24 27 30