使用dplyr和多个语句的函数

时间:2017-02-20 14:25:00

标签: r dplyr lazy-evaluation nse

我在一个函数中使用几个dplyr函数时遇到了麻烦,尽管使用了函数变体。

实施例

library(dplyr)

# Data:
mydf <- data.frame( 
  var1     = factor(rep(1:24, each = 100)),
  var2    = runif(2400, min = -10, max = 125),
  var3     = runif(2400, min = 0, max = 2500),
  var4     = runif(2400, min = - 10, max = 25)  
)

# The function I want to build: 


fx.average <- function(df, varlist) {
  # select some varibles from a data frame
  df <- df %>% dplyr::select_(.dots = varlist)

   # Group by a variable and then just calculate the mean
  df <-df %>% dplyr::group_by_(var1) %>% # added df here
    dplyr::summarise_each_(funs_(mean(., na.rm = TRUE)))
}

所以,现在我将在下面测试该函数:

# Test function, Setup var-list
varlist0 <- c("var1", "var2", "var3")    

fx.average(mydf, varlist0)
# Error in dplyr::group_by_(var1) : object 'var1' not found
#  object 'var1' not found 


# Manual example
mydf %>% dplyr::select(var1, var2, var3) %>% 
  group_by(var1) %>% 
  summarise_each(funs(mean(., na.rm = TRUE)))

不确定出了什么问题?从其他问题来看,它似乎应该通过在函数中添加下划线来解决 - 因为它们是为了在函数内部使用而构建的吗?

1 个答案:

答案 0 :(得分:1)

在OP的代码中,存在一些拼写错误(未指定group_by步骤中的数据以及使用不带引号字符串的NSE并使用带有funs_的{​​{1}} summarise_each_summarise_each有效)

funs