在dplyr中使用带有udf的标准评估

时间:2017-01-13 12:32:32

标签: r dplyr

我正在使用dplyr进行编程,因此我正在使用标准评估。我使用数据框和列名作为参数创建泛型函数。在函数中,我想在数据框的列上应用我自己编写的另一个函数。这是一个最小的例子:

some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
  dat %>% dplyr::summarise_(mean_3 = sprintf("some_udf(%s)", input_var))
}

现在运行泛型函数时,我会收到以下错误:

generic_function(mtcars, 'cyl')

Error: could not find function "some_udf"

some_udf替换为基本R函数时,如meansd,一切正常。

有人可以向我解释为什么udf在这种情况下不起作用以及解决方案可能是什么?

2 个答案:

答案 0 :(得分:3)

这基本上是this question的副本,它没有接受的答案,但正如David Arenburg和MrFlick的评论所指出的那样,你需要将表达式作为公式传递,以便可以使用正确的环境上下文:

library(dplyr)

some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
    dat %>% 
        summarise_(mean_3 = as.formula(sprintf("~some_udf(%s)", input_var)))
}

generic_function(mtcars, 'cyl')
#   mean_3
# 1 9.1875

答案 1 :(得分:2)

阅读nse vignette并使用推荐的interp方法:

generic_function <- function(dat, input_var){
  dat %>% 
    dplyr::summarise_(mean_3 = lazyeval::interp(~some_udf(x), x = as.name(input_var)))
}

generic_function(mtcars, 'cyl')
  mean_3
1 9.1875