编程功能:DPLYR和PURRR中的NSE

时间:2019-04-03 03:41:52

标签: r tidyverse purrr nse

当前,当我尝试将函数包装在我多次使用的dplyr und purrr进行的一些计算周围时,我遇到了非标准评估的一些问题。

我已经阅读了有关NSE的文章,也认为我知道我的功能无法正常工作的地方-但是,我不知道为什么会这样。

示例性地,我想将函数包装在以下计算周围,其中分组变量以及新变量的名称,使用的分类变量和均值的输入变量应该是动态的:

 Data <- Data %>%
  group_by(WeekBeforeRelease) %>%
  mutate(visitors_genreother_instr = map_dbl(Genre_Category, ~ mean(Visitors[Genre_Category != .x]))) %>%
  ungroup() %>%
  as.data.frame()

使用here中所述的NSE将以下功能转换为以下功能:

Function_Other <- function(ENDOGVAR, VARNAME, GROUP_MOVIE, GROUP_TIME){

  ENDOGVAR <- enquo(ENDOGVAR)
  VARNAME <- quo_name(enquo(VARNAME))
  GROUP_MOVIE <- enquo(GROUP_MOVIE)
  GROUP_TIME <- enquo(GROUP_TIME)

  Data <<- Data %>%
    group_by(!!GROUP_TIME) %>%
    mutate(!!VARNAME := map_dbl(!!GROUP_MOVIE, ~mean(!!ENDOGVAR[!!GROUP_MOVIE != .x]))) %>%
    ungroup() %>%
    as.data.frame()
}

但是,在平均值计算中,这似乎不能很好地处理带有括号的子集。如果我用Visitors代替!! ENDOGVAR,一切都会按预期进行。但是,按原样,它会产生以下错误:

Error in NextMethod("[") : object '.x' not found 

我很高兴能为我提供帮助,帮助他们理解这个问题。

非常感谢!

rondo

1 个答案:

答案 0 :(得分:0)

我们可以将!!用大括号括起来,以避免出现任何优先操作,并且现在应该可以正常工作

library(tidyverse)
Function_Other <- function(ENDOGVAR, VARNAME, GROUP_MOVIE, GROUP_TIME){

  ENDOGVAR <- enquo(ENDOGVAR)
  VARNAME <- quo_name(enquo(VARNAME))
  GROUP_MOVIE <- enquo(GROUP_MOVIE)
  GROUP_TIME <- enquo(GROUP_TIME)

  Data %>%
    group_by(!!GROUP_TIME) %>%
    mutate(!!VARNAME := map_dbl(!!GROUP_MOVIE, ~
           mean((!!ENDOGVAR)[(!!GROUP_MOVIE) != .x]))) %>%
    ungroup() %>%
    as.data.frame()

}


Data <- mtcars
out <- Function_Other(mpg, newcol, am, gear)
head(out, 3)
#   mpg cyl disp  hp drat    wt  qsec vs am gear carb newcol
#1 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4  21.05
#2 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4  21.05
#3 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1  21.05