data.table中的非标准评估

时间:2016-09-08 09:49:25

标签: r nse

我对bydata.table的评价感到迷茫。 LJLJ2的功能合并到一个功能中的正确方法是什么?

LJ <- function(dt_x_, dt_y_, by_)
{
    merge(
        dt_x_,
        dt_y_,
        by = eval(substitute(by_)), all.x = TRUE, sort = FALSE)
}
LJ2 <- function(dt_x_, dt_y_, by_)
{
    merge(
        dt_x_,
        dt_y_,
        by = deparse(substitute(by_)), all.x = TRUE, sort = FALSE)
}
LJ(
    data.table(A = c(1,2,3)),
    data.table(A = c(1,2,3), B = c(11,12,13)), 
    "A")
LJ2(
    data.table(A = c(1,2,3)),
    data.table(A = c(1,2,3), B = c(11,12,13)), 
    A)

1 个答案:

答案 0 :(得分:3)

我认为这是一个坏主意。让用户始终传递字符值。你可以这样做:

LJ3 <- function(dt_x_, dt_y_, by_)
{ 
  by_ <- gsub('\"', "", deparse(substitute(by_)), fixed = TRUE)
  dt_y_[dt_x_, on = by_] 
}

LJ3(
  data.table(A = c(4,1,2,3)),
  data.table(A = c(1,2,3), B = c(11,12,13)), 
  A)
#   A  B
#1: 4 NA
#2: 1 11
#3: 2 12
#4: 3 13

LJ3(
  data.table(A = c(4,1,2,3)),
  data.table(A = c(1,2,3), B = c(11,12,13)), 
  "A")
#   A  B
#1: 4 NA
#2: 1 11
#3: 2 12
#4: 3 13

此问题与data.table无关。 by中的merge.data.table参数始终需要字符值,on也是如此。

修改: @eddi指出,如果您的列名称中包含实际",则上述内容将会失败(您应该避免这种情况,但如果您{{{ 1}}其他人准备的一些输入文件。

可以处理此类边缘情况的替代方案是:

fread