SE filter_ by function采用多列

时间:2016-12-21 16:55:47

标签: r dplyr

我想过滤数据框,只留下基于所选列的完整案例。使用NSE filter()

很容易做到这一点
library(dplyr)

dd <- data.frame(
  id = 1:4,
  var1 = c(1, 2, NA, 4),
  var2 = c(1, NA, 3, 4),
  var3 = c(1, NA, NA, NA))

dd1 <- dd %>% filter(complete.cases(var1, var2))
dd1
#>   id var1 var2 var3
#> 1  1    1    1    1
#> 2  4    4    4   NA

但是,我试图生成此操作的SE版本,我可能会传递列的引用名称

library(lazyeval)
filtered_cols <- c("var1", "var2")

dots <- interp(~complete.cases(x), .values = list(x = filtered_cols))

dd2 <- dd %>% filter_(.dots = dots)
#> Error in eval(substitute(expr), envir, enclos): incorrect length (2), expecting: 4

str(dots)
#> Class 'formula'  language ~complete.cases(c("var1", "var2"))
#> ..- attr(*, ".Environment")=<environment: R_GlobalEnv> 

不幸的是,filtered_cols被解析为字符向量。如何将interp()作为多个列名传递给filtered_cols来处理complete.cases()

1 个答案:

答案 0 :(得分:5)

这是uqs()的用途,但您必须使用较新的f_interp()

library(lazyeval)
filtered_cols <- c("var1", "var2")
filtered_col_names <- lapply(filtered_cols, as.name)

dots <- f_interp(~complete.cases(uqs(filtered_col_names)))

dd2 <- dd %>% filter_(.dots = dots)