据我所知,当您要制作包装模型的函数时,有两种处理公式参数的方法。您可以将公式的字符串版本粘贴在一起:
library(tidyverse)
run_model1 <- function(df, dep_str, ...){
groupers <- enquos(...)
formula <- dep_str %>% str_c("~ cty") %>% as.formula()
df %>%
group_by(!!!groupers) %>%
do(model = lm(formula, data = .))
}
或者您可以引用整个公式:
run_model2 <- function(df, formula, ...){
groupers <- enquos(...)
formula <- enexpr(formula)
df %>%
group_by(!!!groupers) %>%
do(model = lm(!!formula, data = .))
}
事实上,这两者都允许我在更改公式中的变量的同时获得分组模型。
run_model1(mpg, "hwy", cyl)
#> Source: local data frame [4 x 2]
#> Groups: <by row>
#>
#> # A tibble: 4 x 2
#> cyl model
#> * <int> <list>
#> 1 4 <S3: lm>
#> 2 5 <S3: lm>
#> 3 6 <S3: lm>
#> 4 8 <S3: lm>
run_model2(mpg, hwy ~ cty, cyl)
#> Source: local data frame [4 x 2]
#> Groups: <by row>
#>
#> # A tibble: 4 x 2
#> cyl model
#> * <int> <list>
#> 1 4 <S3: lm>
#> 2 5 <S3: lm>
#> 3 6 <S3: lm>
#> 4 8 <S3: lm>
但是,第一个要求将引号和未引号的参数混合使用,特别是如果我想访问符号版本以供以后使用时,效果尤其不好。第二个强迫我每次只提供一份,而每次都提供整个配方。
基本上,我如何获得一个带有这样参数的函数?
run_model3(mpg, hwy, cyl)
答案 0 :(得分:1)
ensym()
应该让您捕获提供给该功能的符号。
ensym()
和ensyms()
是enexpr()
和enexprs()
的变体,它们检查 捕获的表达式是一个字符串(它们将转换为 符号)或符号。如果提供了其他任何内容,则会引发错误。
run_model3 <- function (df, dep_str, ...) {
dep_str <- ensym(dep_str)
groupers <- enquos(...)
formula <- dep_str %>% str_c("~ cty") %>% as.formula()
df %>%
group_by(!!!groupers) %>%
do(model = lm(formula, data = .))
}
> run_model3(mpg, hwy, cyl)
Source: local data frame [4 x 2]
Groups: <by row>
# A tibble: 4 x 2
cyl model
* <int> <list>
1 4 <S3: lm>
2 5 <S3: lm>
3 6 <S3: lm>
4 8 <S3: lm>
在引用之前,我们甚至可以使用run_model1
的当前方法:
> run_model3(mpg, "hwy", cyl)
Source: local data frame [4 x 2]
Groups: <by row>
# A tibble: 4 x 2
cyl model
* <int> <list>
1 4 <S3: lm>
2 5 <S3: lm>
3 6 <S3: lm>
4 8 <S3: lm>