使用数据框,我使用dplyr来汇总一些列,如下所示。
> data <- data.frame(a=rep(1:2,3), b=c(6:11))
> data
a b
1 1 6
2 2 7
3 1 8
4 2 9
5 1 10
6 2 11
> data %>% group_by(a) %>% summarize(tot=sum(b))
# A tibble: 2 x 2
a tot
<int> <int>
1 1 24
2 2 27
这很完美。但是我想为此创建一个可重用的函数,以便可以将列名作为参数传递。
查看here等相关问题的答案,我尝试了以下内容。
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize(tot=sum(colName))
df
}
然而,我无法让它发挥作用。
> sumByColumn(data, "b")
Error in summarise_impl(.data, dots) :
Evaluation error: invalid 'type' (character) of argument.
> sumByColumn(data, b)
Error in summarise_impl(.data, dots) :
Evaluation error: object 'b' not found.
>
答案 0 :(得分:6)
这可以使用最新的dplyr
语法(可以在github上看到):
library(dplyr)
library(rlang)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize(tot = sum(!! sym(colName)))
}
sumByColumn(data, "b")
## A tibble: 2 x 2
# a tot
# <int> <int>
#1 1 24
#2 2 27
另一种将b
指定为变量的方法:
library(dplyr)
sumByColumn <- function(df, colName) {
myenc <- enquo(colName)
df %>%
group_by(a) %>%
summarize(tot = sum(!!myenc))
}
sumByColumn(data, b)
## A tibble: 2 x 2
# a tot
# <int> <int>
#1 1 24
#2 2 27
答案 1 :(得分:4)
dplyr
现在还提供辅助函数(summarise_at
,它接受参数vars
,funs
)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize_at(vars(colName), funs(tot = sum))
}
提供相同的答案
# A tibble: 2 x 2
# a tot
# <int> <int>
# 1 1 24
# 2 2 27
答案 2 :(得分:0)
我们可以使用 .data
代词。
library(dplyr)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarise(tot = sum(.data[[colName]]))
}
sumByColumn(data, "b")
# a tot
#* <int> <int>
#1 1 24
#2 2 27