我有一份报告需要应用于data.tables [j和by]的不同名称。
我通过将参数包装在eval(substitute(value))
函数中来完成它的唯一方法。这使代码的可读性降低。
我已将j参数命名为“variable”,但我想将函数的j参数传递给setnames
函数。
所以,问题是:
有没有办法避免eval(substitute(value))
构建?
我可以将j参数传递给setnames函数吗?
library(data.table)
library(ggplot2)
data(diamonds, package = "ggplot2")
dt = as.data.table(diamonds)
var.report = function(df, value, by.value) {
var.report = df[, list( .N,
sum(is.finite(eval(substitute(value)))), # count values
sum(is.na(eval(substitute(value)))) # count NA
), by = eval(substitute(by.value))]
setnames(var.report, c("variable", "N","n.val","n.NA"))
return(var.report)
}
var.report(dt, depth, clarity)
答案 0 :(得分:2)
eval(substitute
如果你想要更具体的话,那么整个函数的整体(或data.table
计算)怎么样:
var.report = function(df, value, by.value) {
eval(substitute({
var.report = df[, list( .N,
sum(is.finite(value)), # count values
sum(is.na(value)) # count NA
), by = by.value]
setnames(var.report, c("variable", "N","n.val","n.NA"))
return(var.report)
}))
}
var.report(dt, depth, clarity)
# variable N n.val n.NA
#1: SI2 9194 9194 0
#2: SI1 13065 13065 0
#3: VS1 8171 8171 0
#4: VS2 12258 12258 0
#5: VVS2 5066 5066 0
#6: VVS1 3655 3655 0
#7: I1 741 741 0
#8: IF 1790 1790 0
我不太了解第二个问题,我通常会在原始表达式中指定名称,这有助于更好地跟踪事情,如下所示:
var.report = df[, list(N = .N,
n.val = sum(is.finite(value)), # count values
n.NA = sum(is.na(value)) # count NA
)
, by = list(variable = by.value)]