要从数据框中选择几列,我可以
require(dplyr)
require(magrittr)
df <- data.frame(col1=c(1, 2, 3), col2=letters[1:3], col3=LETTERS[4:6])
df %>%
select(col1, col2)
我想写一个类似于
的函数f <- function(data, firstCol, secondCol){
data %>%
select(substitute(firstCol), substitute(secondCol))
}
但是运行f(df, col1, col2)
会给我错误
Error in select_vars(names(.data), ..., env = parent.frame()) :
(list) object cannot be coerced to type 'double'
Called from: (function ()
{
.rs.breakOnError(TRUE)
})()
编辑 - 稍微不那么简单的例子:
假设我想做
mtcars %>%
select(cyl, hp) %>%
unique %>%
group_by(cyl) %>%
summarise(avgHP = mean(hp))
但具有不同的数据集和不同的变量名称。我可以重复使用代码并替换mtcars
,cyl
和hp
。但我宁愿把它全部包装在一个函数中
答案 0 :(得分:5)
在这种情况下非常简单,因为你可以使用......
f <- function(data, ...) {
data %>% select(...)
}
f(df, col1, col2)
#> col1 col2
#> 1 1 a
#> 2 2 b
#> 3 3 c
在更一般的情况下,您有两种选择:
substitute()
构建完整的表达式,然后
eval()
答案 1 :(得分:0)
从rlang版本0.4.0开始,卷曲{{
运算符将是一个更好的解决方案。
f <- function(data, firstCol, secondCol){
data %>%
select({{ firstCol }}, {{ secondCol }})
}
df <- data.frame(col1=c(1, 2, 3), col2=letters[1:3], col3=LETTERS[4:6])
df %>% f(col1, col2)
# col1 col2
# 1 1 a
# 2 2 b
# 3 3 c