基于字符串的dplyr过滤 - NSE

时间:2017-09-11 11:20:45

标签: r dplyr tidyverse nse tidyeval

我希望在我的数据上使用dplyr的新NSE表示法(版本> = 0.6)作为动态filter。我们假设我有以下虚拟数据集:

df = data_frame(x = 1:10, y = 10:1, z = 10 * runif(10))

如果现在我想过滤列tofilter = "x"以获取大于5的值,我知道我可以这样做:

df %>% 
  filter((!!rlang::sym(tofilter)) >= 5)

问题1

如果我想动态更改过滤操作符怎么办(让我说我有一个Shiny App,用户可以动态selectInput过滤数据大于5的数据,等于5或低于5?

我想做的事情就是:

op = ">="
val = 5
filt_expr = paste("x", op, val)
df %>% 
  filter(filt_expr)

显然,这不起作用,我使用了rlang quosore / symbols等,但没有找到正确的方法来引用"引用"我的意见。

问题2

奖金问题是,如果我想应用多个过滤器该怎么办?我是否需要循环或者我可以创建一个过滤表达式列表并一次性应用它们?

一个例子是Shiny App,用户可以输入他/她想要应用于数据的多个条件,以便我们有一个动态变化的格式列表:

filt_expr_list = list("x >= 5", "y <= 10", "z >= 2")

我们希望动态应用它们,以便输出等同于:

df %>%
  filter(x >= 5, y <= 10, z >= 2)

我想这在某种意义上是问题1的一个子集,因为当我知道如何正确引用这些论点时,我认为我可以这样做:

filt_expr = paste0(unlist(filt_expr_list), collapse = ", ")
df %>%
  filter(filt_expr)

但很高兴看到是否有更好的清洁方式

2 个答案:

答案 0 :(得分:5)

  

如果我想动态更改过滤操作符怎么办

您可以通过取消表示操作符的符号来指定整齐的eval(注意我使用expr()来说明取消引用的结果):

lhs <- "foo"

# Storing the symbol `<` in `op`
op <- quote(`<`)

expr(`!!`(op)(!!sym(lhs), 5))
#> foo < 5

然而,使用常规R代码在整洁的eval之外做它更干净。只有当您取消引用的符号表示数据框中的列时,才需要取消引用,即不在上下文中的内容。在这里,您可以将运算符存储在变量中,然后在过滤表达式中调用该变量:

# Storing the function `<` in `op`
op <- `<`

expr(op(!!sym(lhs), 5))
#> op(foo, 5)
  

如果我想应用多个过滤器怎么办?

您将表达式保存在列表中,然后在使用!!!的通话中拼接它们:

filters <- list(
  quote(x >= 5),
  quote(y <= 10),
  quote(z >= 2)
)

expr(df %>% filter(!!!filters))
#> df %>% filter(x >= 5, y <= 10, z >= 2)`

注意:我上面说过没有必要从上下文中取消引用变量,但如果你正在编写一个具有数据框的函数,那么这通常是个好主意。作为输入。由于数据框是可变的,因此您事先不知道它包含哪些列。列始终优先于您在环境中定义的对象。在这种情况下,这不是问题,因为我们正在谈论一个函数,如果R在数据框中找到一个类似命名的对象,它将继续寻找函数。

答案 1 :(得分:0)

您实际上可以这样做:

    df = data_frame(x = 1:10, y = 10:1, z = 10 * runif(10))
    op = ">="
    val = 5
    filt_expr = paste("x", op, val)

    df %>% filter(eval(parse(filt_expr)))