我正在使用dplyr进行编程,因此我正在使用标准评估。我使用数据框和列名作为参数创建泛型函数。在函数中,我想在数据框的列上应用我自己编写的另一个函数。这是一个最小的例子:
some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
dat %>% dplyr::summarise_(mean_3 = sprintf("some_udf(%s)", input_var))
}
现在运行泛型函数时,我会收到以下错误:
generic_function(mtcars, 'cyl')
Error: could not find function "some_udf"
当some_udf
替换为基本R函数时,如mean
或sd
,一切正常。
有人可以向我解释为什么udf在这种情况下不起作用以及解决方案可能是什么?
答案 0 :(得分:3)
这基本上是this question的副本,它没有接受的答案,但正如David Arenburg和MrFlick的评论所指出的那样,你需要将表达式作为公式传递,以便可以使用正确的环境上下文:
library(dplyr)
some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
dat %>%
summarise_(mean_3 = as.formula(sprintf("~some_udf(%s)", input_var)))
}
generic_function(mtcars, 'cyl')
# mean_3
# 1 9.1875
答案 1 :(得分:2)
阅读nse
vignette并使用推荐的interp
方法:
generic_function <- function(dat, input_var){
dat %>%
dplyr::summarise_(mean_3 = lazyeval::interp(~some_udf(x), x = as.name(input_var)))
}
generic_function(mtcars, 'cyl')
mean_3 1 9.1875