我有以下data.table
:
> dt = data.table(expr = c("a + b", "a - b", "a * b", "a / b"), a = c(1,2,3,4), b = c(5,6,7,8))
> dt
expr a b
1: a + b 1 5
2: a - b 2 6
3: a * b 3 7
4: a / b 4 8
我的目标是获得以下data.table
:
> dt
expr a b ans
1: a + b 1 5 6
2: a - b 2 6 -4
3: a * b 3 7 21
4: a / b 4 8 0.5
我尝试了以下内容:
> dt[, ans := eval(expr)]
Error in eval(expr, envir, enclos) : object 'expr' not found
> dt[, ans := eval(parse(text = expr))]
Error in parse(text = expr) : object 'expr' not found
知道如何根据ans
列中的表达式计算expr
列?
答案 0 :(得分:12)
如果你的实际表达式描述了对向量化函数的调用并且每次重复多次,这可能会更有效,因为它只会解析和评估每个不同的表达式一次:
f <- function(e, .SD) eval(parse(text=e[1]), envir=.SD)
dt[, ans:=f(expr,.SD), by=expr, .SDcols=c("a", "b")]
# expr a b ans
# 1: a + b 1 5 6.0
# 2: a - b 2 6 -4.0
# 3: a * b 3 7 21.0
# 4: a / b 4 8 0.5
答案 1 :(得分:6)
实际上,在这样的设置中,矢量化存在许多挑战。 eval
不期望在表达式向量上运行,也不会将其设置为默认情况下迭代环境向量。在这里,我定义了一个辅助函数来包装大部分迭代
calc <- function(e, ...) {
run<-function(x, ...) {
eval(parse(text=x), list(...))
}
do.call("mapply", c(list(run, e), list(...)))
}
dt[, ans:=calc(expr,a=a,b=b)]
返回
expr a b ans
1: a + b 1 5 6.0
2: a - b 2 6 -4.0
3: a * b 3 7 21.0
4: a / b 4 8 0.5
根据需要。请注意,您需要在调用calc()
时命名参数,以便它知道要映射到哪个列的变量。