我希望能够为dplyr
动词定义参数
condition <- "dist > 50"
然后在dplyr
函数中使用这些字符串:
require(ggplot2)
ds <- cars
ds1 <- ds %>%
filter (eval(condition))
ds1
但它会引发错误
Error: filter condition does not evaluate to a logical vector.
代码应评估为:
ds1<- ds %>%
filter(dist > 50)
ds1
导致:
DS1
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
5 18 76
6 18 84
7 19 68
8 20 52
9 20 56
10 20 64
11 22 66
12 23 54
13 24 70
14 24 92
15 24 93
16 24 120
17 25 85
如何在dplyr
动词中将字符串作为参数传递?
答案 0 :(得分:14)
在dplyr的下一个版本中,它可能会像这样工作:
condition <- quote(dist > 50)
mtcars %>%
filter_(condition)
答案 1 :(得分:3)
虽然他们正在努力解决这个问题,但这是使用if
的解决方法:
library(dplyr)
library(magrittr)
ds <- data.frame(attend = c(1:5,NA,7:9,NA,NA,12))
filter_na <- FALSE
filtertest <- function(x,filterTF = filter_na){
if(filterTF) x else !(x)
}
ds %>%
filter(attend %>% is.na %>% filtertest)
attend
1 1
2 2
3 3
4 4
5 5
6 7
7 8
8 9
9 12
filter_na <- TRUE
ds %>%
filter(attend %>% is.na %>% filtertest)
attend
1 NA
2 NA
3 NA
答案 2 :(得分:2)
自2014年以来,使用rlang's quasiquotation可以采用两种新方法。
常规硬编码过滤器语句。为了便于比较,语句dist > 50
直接包含在dplyr::filter()
中。
library(magrittr)
# The filter statement is hard-coded inside the function.
cars_subset_0 <- function( ) {
cars %>%
dplyr::filter(dist > 50)
}
cars_subset_0()
结果:
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
...
17 25 85
具有NSE(非标准评估)的郎朗方法。如Programming with dplyr插图中所述,dist > 50
的声明由rlang::enquo()
处理,“使用了一些看看参数,查看用户键入的内容,然后将该值作为quosure返回”。然后,rlang的!!
取消对输入的引用,“以便在周围环境中立即对其进行评估”。
# The filter statement is evaluated with NSE.
cars_subset_1 <- function( filter_statement ) {
filter_statement_en <- rlang::enquo(filter_statement)
message("filter statement: `", filter_statement_en, "`.")
cars %>%
dplyr::filter(!!filter_statement_en)
}
cars_subset_1(dist > 50)
结果:
filter statement: `~dist > 50`.
<quosure>
expr: ^dist > 50
env: global
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
17 25 85
rlang方法传递字符串。语句"dist > 50"
作为显式字符串传递给函数,并由rlang::parse_expr()
解析为表达式,然后由{{ 1}}。
!!
结果:
# The filter statement is passed a string.
cars_subset_2 <- function( filter_statement ) {
filter_statement_expr <- rlang::parse_expr(filter_statement)
message("filter statement: `", filter_statement_expr, "`.")
cars %>%
dplyr::filter(!!filter_statement_expr)
}
cars_subset_2("dist > 50")
filter statement: `>dist50`.
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
...
17 25 85
使事情变得更简单。显式字符串仅需要dplyr::select()
。
!!