如何在R中的函数内使用dplyr / magrittr的管道?

时间:2016-02-11 17:22:48

标签: r dplyr magrittr nse

我试图编写一个函数,该函数将数据帧和函数的名称作为参数。当我尝试使用标准R语法编写函数时,我可以使用evalsubstitute按照http://adv-r.had.co.nz/Computing-on-the-language.html

中的@hadley的推荐获得良好的结果
> df <- data.frame(y = 1:10)
> f <- function(data, x) {
+   out <- mean(eval(expr = substitute(x), envir = data))
+   return(out)
+ }
> f(data = df, x = y)
[1] 5.5

现在,当我尝试使用%>%运算符编写相同的函数时,它不起作用:

> df <- data.frame(y = 1:10)
> f <- function(data, x) {
+   data %>% 
+     eval(expr = substitute(x), envir = .) %>% 
+     mean()
+ }
> f(data = df, x = y)
Show Traceback
Rerun with Debug
 Error in eval(expr, envir, enclos) : objet 'y' introuvable 
> 

如何使用管道操作符与evalsubstitute的组合使用?这对我来说似乎很棘手。

3 个答案:

答案 0 :(得分:6)

解决方法是

f <- function(data, x) {
  v <- substitute(x)
  data %>% 
    eval(expr = v, envir = .) %>%
    mean()
}

问题是管道函数(%>%)正在创建另一个级别的闭包,这会干扰substitute(x)的评估。您可以看到与此示例的区别

df <- data.frame(y = 1:10)
f1 <- function(data, x) {
  print(environment())
  eval(expr = environment(), envir = data)
}

f2 <- function(data, x) {
  print(environment())
  data %>% 
    eval(expr = environment(), envir = .)
}
f1(data = df, x = y)
# <environment: 0x0000000006388638>
# <environment: 0x0000000006388638>
f2(data = df, x = y)
# <environment: 0x000000000638a4a8>
# <environment: 0x0000000005f91ae0>

注意matrittr版本中的环境有何不同。你想在非标准评估中尽快处理substitute内容。

我希望你的用例比你的例子复杂一点,因为它似乎是

mean(df$y)

将是一个更容易阅读的代码。

答案 1 :(得分:3)

我一直试图了解我的问题。

首先,我用summarise()函数编写了我想要的内容:

> library(dplyr)
> df <- data.frame(y = 1:10)
> summarise_(.data = df, mean = ~mean(y))
  mean
1  5.5

然后我尝试编写自己的功能。我找到了一个似乎与this post中的lazyeval包一起使用的解决方案。我使用lazy()interp()函数来编写我想要的内容。

第一种可能性是:

> library(lazyeval)
> f <- function(data, col) {
+   col <- lazy(col)
+   inter <- interp(~mean(x), x = col)
+   summarise_(.data = data, mean = inter)    
+   }
> f(data = df, col = y)
  mean
1  5.5

我也可以使用管道:

> f <- function(data, col) {
+   col <- lazy(col)
+   inter <- interp(~mean(x), x = col)
+   data %>% 
+     summarise_(.data = ., mean = inter)    
+ }
> 
> f(data = df, col = y)
  mean
1  5.5

答案 2 :(得分:0)

我不会使用 eval 和替换。

以下是适合您问题的简化版 this great post

df <- data.frame(y = 1:10)
f <- function(data, x) {
  x <- enquo(x)
  df %>% summarise(mean = mean(!!x))
   }
f(data = df, x = y)

这里发生了两件事:

  1. 使用 enquo() 转换列名
  2. 使用 !! 为列添加前缀

请参阅链接以获得更复杂的示例。