考虑这个简单的例子
library(dplyr)
dataframe <- data_frame(id = c(1,2,3,4),
group = c('a','b','c','c'),
value = c(200,400,120,300))
> dataframe
# A tibble: 4 x 3
id group value
<dbl> <chr> <dbl>
1 1 a 200
2 2 b 400
3 3 c 120
4 4 c 300
以及 tidyeval 函数,该函数使用dplyr
根据某个输入列聚合我的数据框。
func_tidy <- function(data, mygroup){
quo_var <- enquo(mygroup)
df_agg <- data %>%
group_by(!!quo_var) %>%
summarize(mean = mean(value, na.rm = TRUE),
count = n()) %>%
ungroup()
df_agg
}
现在,这可行
> func_tidy(dataframe, group)
# A tibble: 3 x 3
group mean count
<chr> <dbl> <int>
1 a 200 1
2 b 400 1
3 c 210 2
但是在循环 FAILS
中做同样的事情for(col in c(group)){
func_tidy(dataframe, col)
}
Error in grouped_df_impl(data, unname(vars), drop) : Column `col` is unknown
这是什么问题?如何在循环中使用我的tidyeval
函数?
谢谢!
答案 0 :(得分:4)
要循环列名,您需要使用字符串。
for(col in "group")
将此变量传递给函数时,需要使用rlang::sym
将其从字符串转换为符号。您使用!!
取消引用,以便评估表达式。
所以你的循环看起来像(我添加print
来查看输出):
for(col in "group"){
print( func_tidy(dataframe, !! rlang::sym(col) ) )
}
# A tibble: 3 x 3
group mean count
<chr> <dbl> <int>
1 a 200 1
2 b 400 1
3 c 210 2