评估R data.table中的表达式

时间:2015-02-04 17:34:17

标签: r eval data.table

我有以下data.table

> dt = data.table(expr = c("a + b", "a - b", "a * b", "a / b"), a = c(1,2,3,4), b = c(5,6,7,8))
> dt
    expr a b
1: a + b 1 5
2: a - b 2 6
3: a * b 3 7
4: a / b 4 8

我的目标是获得以下data.table

> dt
    expr a b ans
1: a + b 1 5   6
2: a - b 2 6  -4
3: a * b 3 7  21
4: a / b 4 8 0.5

我尝试了以下内容:

> dt[, ans := eval(expr)]
Error in eval(expr, envir, enclos) : object 'expr' not found

> dt[, ans := eval(parse(text = expr))]
Error in parse(text = expr) : object 'expr' not found

知道如何根据ans列中的表达式计算expr列?

2 个答案:

答案 0 :(得分:12)

如果你的实际表达式描述了对向量化函数的调用并且每次重复多次,这可能会更有效,因为它只会解析和评估每个不同的表达式一次:

f <- function(e, .SD) eval(parse(text=e[1]), envir=.SD)
dt[, ans:=f(expr,.SD), by=expr, .SDcols=c("a", "b")]
#     expr a b  ans
# 1: a + b 1 5  6.0
# 2: a - b 2 6 -4.0
# 3: a * b 3 7 21.0
# 4: a / b 4 8  0.5

答案 1 :(得分:6)

实际上,在这样的设置中,矢量化存在许多挑战。 eval不期望在表达式向量上运行,也不会将其设置为默认情况下迭代环境向量。在这里,我定义了一个辅助函数来包装大部分迭代

calc <- function(e, ...) {
   run<-function(x, ...) {
       eval(parse(text=x), list(...)) 
   }
   do.call("mapply", c(list(run, e), list(...)))
}

dt[, ans:=calc(expr,a=a,b=b)]

返回

    expr a b  ans
1: a + b 1 5  6.0
2: a - b 2 6 -4.0
3: a * b 3 7 21.0
4: a / b 4 8  0.5

根据需要。请注意,您需要在调用calc()时命名参数,以便它知道要映射到哪个列的变量。