如何使用循环的tidyeval函数?

时间:2017-08-25 16:31:27

标签: r dplyr tidyeval

考虑这个简单的例子

library(dplyr)

dataframe <- data_frame(id = c(1,2,3,4),
                        group = c('a','b','c','c'),
                        value = c(200,400,120,300))


> dataframe
# A tibble: 4 x 3
     id group value
  <dbl> <chr> <dbl>
1     1     a   200
2     2     b   400
3     3     c   120
4     4     c   300

以及 tidyeval 函数,该函数使用dplyr根据某个输入列聚合我的数据框。

func_tidy <- function(data, mygroup){
  quo_var <- enquo(mygroup)

  df_agg <- data %>% 
    group_by(!!quo_var) %>% 
    summarize(mean = mean(value, na.rm = TRUE),
              count = n()) %>% 
    ungroup()

  df_agg
}

现在,这可行

> func_tidy(dataframe, group)
# A tibble: 3 x 3
  group  mean count
  <chr> <dbl> <int>
1     a   200     1
2     b   400     1
3     c   210     2

但是在循环 FAILS

中做同样的事情
for(col in c(group)){
  func_tidy(dataframe, col)
}
 Error in grouped_df_impl(data, unname(vars), drop) : Column `col` is unknown 

这是什么问题?如何在循环中使用我的tidyeval函数?

谢谢!

1 个答案:

答案 0 :(得分:4)

要循环列名,您需要使用字符串。

for(col in "group")

将此变量传递给函数时,需要使用rlang::sym将其从字符串转换为符号。您使用!!取消引用,以便评估表达式。

所以你的循环看起来像(我添加print来查看输出):

for(col in "group"){
    print( func_tidy(dataframe, !! rlang::sym(col) ) )
}

# A tibble: 3 x 3
  group  mean count
  <chr> <dbl> <int>
1     a   200     1
2     b   400     1
3     c   210     2