如何以编程方式过滤dplyr中的列?

时间:2017-08-11 01:53:22

标签: r dplyr rlang tidyeval

如果在调用函数之前我不想指定列,我如何创建一个删除列中NA值的函数?

minimal_case <- function(column_name = "a") {
  enquo_name <- enquo(column_name)

  example <- tibble(a = c(NA, 1))

  print(filter(example, !is.na(a)))

  print(filter(example, !is.na(rlang::UQ(enquo_name))))

}

第一个print语句的输出是:

# A tibble: 1 x 1
      a
  <dbl>
1     1

第二个印刷语句的输出是:

# A tibble: 2 x 1
      a
  <dbl>
1    NA
2     1

如何让第二个print语句与第一个匹配?

2 个答案:

答案 0 :(得分:2)

似乎column_name参数是一个字符串。在这种情况下,您可以使用rlang::sym

minimal_case <- function(column_name = "a") {
    example <- tibble(a = c(NA, 1))

    print(filter(example, !is.na(a)))

    print(filter(example, !is.na(!!rlang::sym(column_name))))

}

答案 1 :(得分:1)

有关如何在dplyr中执行此类操作的详细说明:http://dplyr.tidyverse.org/articles/programming.html

此案例的妙语是您不必在参数中引用a。您也可以使用!!代替UQ

minimal_case <- function(column_name = a) {
    enquo_name <- enquo(column_name)

    example <- tibble(a = c(NA, 1))

    print(filter(example, !is.na(a)))

    print(filter(example, !is.na(!!enquo_name)))

}