在tidyeval中包装模型时,如何更改公式参数的一部分?

时间:2018-10-19 09:51:38

标签: r tidyeval

据我所知,当您要制作包装模型的函数时,有两种处理公式参数的方法。您可以将公式的字符串版本粘贴在一起:

library(tidyverse)
run_model1 <- function(df, dep_str, ...){
  groupers <- enquos(...)
  formula <- dep_str %>% str_c("~ cty") %>% as.formula()
  df %>%
    group_by(!!!groupers) %>%
    do(model = lm(formula, data = .))
}

或者您可以引用整个公式:

run_model2 <- function(df, formula, ...){
  groupers <- enquos(...)
  formula <- enexpr(formula)
  df %>%
    group_by(!!!groupers) %>%
    do(model = lm(!!formula, data = .))
}

事实上,这两者都允许我在更改公式中的变量的同时获得分组模型。

run_model1(mpg, "hwy", cyl)
#> Source: local data frame [4 x 2]
#> Groups: <by row>
#> 
#> # A tibble: 4 x 2
#>     cyl model   
#> * <int> <list>  
#> 1     4 <S3: lm>
#> 2     5 <S3: lm>
#> 3     6 <S3: lm>
#> 4     8 <S3: lm>
run_model2(mpg, hwy ~ cty, cyl)
#> Source: local data frame [4 x 2]
#> Groups: <by row>
#> 
#> # A tibble: 4 x 2
#>     cyl model   
#> * <int> <list>  
#> 1     4 <S3: lm>
#> 2     5 <S3: lm>
#> 3     6 <S3: lm>
#> 4     8 <S3: lm>

但是,第一个要求将引号和未引号的参数混合使用,特别是如果我想访问符号版本以供以后使用时,效果尤其不好。第二个强迫我每次只提供一份,而每次都提供整个配方。

基本上,我如何获得一个带有这样参数的函数?

run_model3(mpg, hwy, cyl)

1 个答案:

答案 0 :(得分:1)

ensym()应该让您捕获提供给该功能的符号。

  

ensym()ensyms()enexpr()enexprs()的变体,它们检查   捕获的表达式是一个字符串(它们将转换为   符号)或符号。如果提供了其他任何内容,则会引发错误。

source

run_model3 <- function (df, dep_str, ...) {
  dep_str <- ensym(dep_str)
  groupers <- enquos(...)
  formula <- dep_str %>% str_c("~ cty") %>% as.formula()
  df %>%
    group_by(!!!groupers) %>%
    do(model = lm(formula, data = .))
}

> run_model3(mpg, hwy, cyl)
Source: local data frame [4 x 2]
Groups: <by row>

# A tibble: 4 x 2
    cyl model   
* <int> <list>  
1     4 <S3: lm>
2     5 <S3: lm>
3     6 <S3: lm>
4     8 <S3: lm>

在引用之前,我们甚至可以使用run_model1的当前方法:

> run_model3(mpg, "hwy", cyl)
Source: local data frame [4 x 2]
Groups: <by row>

# A tibble: 4 x 2
    cyl model   
* <int> <list>  
1     4 <S3: lm>
2     5 <S3: lm>
3     6 <S3: lm>
4     8 <S3: lm>