将变量和名称传递给data.table函数

时间:2014-06-23 08:09:19

标签: r data.table

我有一份报告需要应用于data.tables [j和by]的不同名称。 我通过将参数包装在eval(substitute(value))函数中来完成它的唯一方法。这使代码的可读性降低。 我已将j参数命名为“variable”,但我想将函数的j参数传递给setnames函数。

所以,问题是:

有没有办法避免eval(substitute(value))构建?

我可以将j参数传递给setnames函数吗?

library(data.table)
library(ggplot2)
data(diamonds, package = "ggplot2")
dt = as.data.table(diamonds)

var.report = function(df, value, by.value) {
  var.report = df[, list( .N,
                    sum(is.finite(eval(substitute(value)))), # count values
                    sum(is.na(eval(substitute(value)))) # count NA
  ), by = eval(substitute(by.value))]

  setnames(var.report, c("variable", "N","n.val","n.NA"))

  return(var.report)
}


var.report(dt, depth, clarity)

1 个答案:

答案 0 :(得分:2)

eval(substitute如果你想要更具体的话,那么整个函数的整体(或data.table计算)怎么样:

var.report = function(df, value, by.value) {
  eval(substitute({
    var.report = df[, list( .N,
                      sum(is.finite(value)), # count values
                      sum(is.na(value)) # count NA
    ), by = by.value]

    setnames(var.report, c("variable", "N","n.val","n.NA"))

    return(var.report)
  }))
}

var.report(dt, depth, clarity)
#   variable     N n.val n.NA
#1:      SI2  9194  9194    0
#2:      SI1 13065 13065    0
#3:      VS1  8171  8171    0
#4:      VS2 12258 12258    0
#5:     VVS2  5066  5066    0
#6:     VVS1  3655  3655    0
#7:       I1   741   741    0
#8:       IF  1790  1790    0

我不太了解第二个问题,我通常会在原始表达式中指定名称,这有助于更好地跟踪事情,如下所示:

var.report = df[, list(N     = .N,
                       n.val = sum(is.finite(value)), # count values
                       n.NA  = sum(is.na(value)) # count NA
                      )
                , by = list(variable = by.value)]