整齐的评估is explained in this article的新的卷曲卷曲方法。给出了几个例子,证明了这种风格的非标准评估(NSE)的使用。
library(tidyverse)
# Example 1 --------------------------
max_by <- function(data, var, by) {
data %>%
group_by({{ by }}) %>%
summarise(maximum = max({{ var }}, na.rm = TRUE))
}
starwars %>% max_by(height)
starwars %>% max_by(height, by = gender)
# Example 2 --------------------------
summarise_by <- function(data, ..., by) {
data %>%
group_by({{ by }}) %>%
summarise(...)
}
starwars %>%
summarise_by(average = mean(height, na.rm = TRUE),
maximum = max(height, na.rm = TRUE),
by = gender)
我创建了一些自己的功能,并且确实是一个更易于开发的框架,而不必担心所有的夸张,刘海和所有这些。
但是,this same article explains that我们还没有完全走出困境:
您只需要引用和取消引用(带有复数形式的enquos()和 !!!),当您需要以某种方式修改输入或输入名称时。
...,但未提供示例。不抱怨,只是问是否有人可以填补空白并提供示例。
对我的评价不流利,我真的不明白作者对这句话的理解。
答案 0 :(得分:4)
假设您需要以下功能的版本,该版本需要多个输入而不是一个var
:
mean_by <- function(data, var, by) {
data %>%
group_by({{ by }}) %>%
summarise(average = mean({{ var }}, na.rm = TRUE))
}
您不能只传递...
来进行总结,因为那样的话,用户需要自己调用mean()
。
mean_by <- function(data, var, ..., by) {
data %>%
group_by({{ by }}) %>%
summarise(...)
}
mtcars %>% mean_by(foo = disp)
#> Error: Column `foo` must be length 1 (a summary value), not 32
mtcars %>% mean_by(foo = mean(disp))
#> # A tibble: 1 x 1
#> foo
#> <dbl>
#> 1 231.
解决方案是用引号引起来,修改每个输入,以便将它们包装在对mean()
的新调用中,然后将它们拼接起来:
mean_by <- function(data, ..., by) {
# `.named` makes sure the dots have default names, if not supplied
dots <- enquos(..., .named = TRUE)
# Go over all inputs, and wrap them in a call
dots <- lapply(dots, function(dot) call("mean", dot, na.rm = TRUE))
# Finally, splice the expressions back into `summarise()`:
data %>%
group_by({{ by }}) %>%
summarise(!!!dots)
}
我们正在考虑如何改善这种情况的语法。 http://rpubs.com/lionel-/superstache
的早期想法