R:使用字符串作为参数来改变dplyr中的动词

时间:2018-03-24 21:09:26

标签: r dplyr nse tidyeval

我正在构建一个闪亮的应用程序,需要允许用户定义用于绘图的新变量。具体来说,我想允许用户定义一个在mutate动词中使用的表达式。服务器接收表达式作为文本,我想知道如何使mutate在dplyr 0.7中执行它。我可以使用mutate_使其工作(部分),但现在已弃用。它还将新列名称定义为整个表达式而不是新变量

这是一个可重复的例子:

input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
iris_mutated <- iris %>% mutate_(input_from_shiny)

这给出了以下

> head(iris_mutated)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species Petal.ratio = Petal.Length/Petal.Width
1          5.1         3.5          1.4         0.2  setosa                                   7.00
2          4.9         3.0          1.4         0.2  setosa                                   7.00
3          4.7         3.2          1.3         0.2  setosa                                   6.50
4          4.6         3.1          1.5         0.2  setosa                                   7.50
5          5.0         3.6          1.4         0.2  setosa                                   7.00
6          5.4         3.9          1.7         0.4  setosa                                   4.25

从技术上讲,我可以使用正则表达式从字符串中提取新的变量名并相应地重命名新列,但我想知道使用最新的dplyr版本实现它的正确方法是什么(正在阅读https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html,但无法弄明白)

2 个答案:

答案 0 :(得分:10)

我们可以将rlang::parse_quosure()!!(bang bang)一起使用来产生相同的结果:

  • parse_quosure:解析提供的字符串并将其转换为quosure

  • !!:取消引用quosure,以便tidyeval动词评估

请注意,parse_quosure()已被软弃用,并根据其文档在parse_quo()中重命名为rlang 0.2.0。如果我们使用parse_quo(),我们需要为quosures指定环境,例如parse_quo(input_from_shiny, env = caller_env())

library(rlang)
library(tidyverse)

input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
iris_mutated <- iris %>% mutate_(input_from_shiny)

iris_mutated2 <- iris %>% 
  mutate(!!parse_quosure(input_from_shiny))
head(iris_mutated2)

#>   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1          5.1         3.5          1.4         0.2  setosa
#> 2          4.9         3.0          1.4         0.2  setosa
#> 3          4.7         3.2          1.3         0.2  setosa
#> 4          4.6         3.1          1.5         0.2  setosa
#> 5          5.0         3.6          1.4         0.2  setosa
#> 6          5.4         3.9          1.7         0.4  setosa
#>   Petal.ratio = Petal.Length/Petal.Width
#> 1                                   7.00
#> 2                                   7.00
#> 3                                   6.50
#> 4                                   7.50
#> 5                                   7.00
#> 6                                   4.25


identical(iris_mutated, iris_mutated2)
#> [1] TRUE

修改以分隔LHS&amp; RHS

lhs <- "Petal.ratio"
rhs <- "Petal.Length/Petal.Width"

iris_mutated3 <- iris %>% 
  mutate(!!lhs := !!parse_quosure(rhs))
head(iris_mutated3)

> head(iris_mutated3)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
  Petal.ratio
1        7.00
2        7.00
3        6.50
4        7.50
5        7.00
6        4.25

reprex package(v0.2.0)创建于2018-03-24。

答案 1 :(得分:1)

Package friendlyeval是简化评估的简化界面,在这种情况下可以使事情变得更加直接。

将您的字符串一分为二,可以获得希望用作列名的字符串的一部分和希望用作表达式的字符串的一部分。所以你可以这样写:

library(friendlyeval)
library(dplyr)
lhs <- "Petal.ratio"
rhs <- "Petal.Length/Petal.Width"

iris_mutated3 <- 
  iris %>% 
  mutate(!!treat_string_as_col(lhs) := !!treat_string_as_expr(rhs))
head(iris_mutated3)

通过使用lhs上的函数,您可以检查lhs是否可以解析为纯列名称。

friendlyeval代码可以使用RStudio插件随时转换为纯净的评估代码。