如何将字符串中的表达式传递给dplyr 0.7.2中的动词

时间:2018-04-12 17:55:55

标签: r dplyr rlang

我正在尝试实施我在网络上找到的建议,但我已经到了想要去的地方。

这是一个可重复的例子:

library(tidyverse)
library(dplyr)
library(rlang)

data(mtcars)

filter_expr = "am == 1"

mutate_expr = "gear_carb = gear*carb"

select_expr = "mpg , cyl"

mtcars %>% filter_(filter_expr) %>% mutate_(mutate_expr) %>% select_(select_expr)

过滤器表达效果很好。

mutate 表达式也可以,但新变量的名称为 gear_carb = gear * carb ,而不是预期的 gear_carb

最后, select 表达式返回异常。

您的建议将不胜感激。

1 个答案:

答案 0 :(得分:3)

如评论中所述,dplyr动词的下划线版本现已被弃用。如今,正确的方法是使用quasiquotation

要解决select的问题,您只需要修改select_expr以包含多个表达式即可。

## I renamed your variables to *_str because they are, well, strings.
filter_str <- "am == 1"
mutate_str <- "gear_carb = gear*carb"
select_str <- "mpg; cyl"                # Note the ;

接下来,我们使用rlang::parse_expr将这些字符串转换为未求值的表达式:

filter_expr <- rlang::parse_expr( filter_str )
# am == 1
mutate_expr <- rlang::parse_expr( mutate_str )
# gear_carb = gear * carb

## Notice the plural parse_exprs, which parses a list of expressions
select_expr <- rlang::parse_exprs( select_str )
# [[1]]
# mpg
#
# [[2]]
# cyl

鉴于未计算的表达式,我们现在可以将它们传递给dplyr动词。但是,动词本身会将其自变量捕获为未评估的表达(一种称为“引号”的动作)。例如,filter( filter_expr )将捕获filter_expr作为未计算的表达式。但是,我们不希望表达式filter_expr本身。我们希望表达式am == 1已经存储在名为 filter_expr的变量中。

为防止这种“双引号”(即,创建第二级不求值),我们使用!!运算符让dplyr动词知道参数已包含未求值的表达式:

mtcars %>% filter( !!filter_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
# 4  32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1

mtcars %>% mutate( !!mutate_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb gear_carb = gear * carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4                      16
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4                      16
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1                       4
# 4  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1                       3

对于select,我们有多个表达式,而由!!!处理:

mtcars %>% select( !!!select_expr )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4

P.S。还值得一提的是选择帮助器one_of,它可以让用户直接使用字符串,而不必先rlang::parse_expr()来使用字符串:

mtcars %>% select( one_of( "mpg", "cyl" ) )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4