我试图传递两组列名称以起作用,并使用dplyr对它们进行处理。通常对于一组,我将使用省略号(...)并通过enquos()将其转换为quosures。但是现在我有两组列名,因此我考虑使用列表来存储它们。我应该如何以最有效的方式进行这项工作? (最欢迎使用purrr,rlang和任何其他软件包的功能的答案)
数据包和示例
library(dplyr) #I use whole library(tidyverse) but this is sufficient for this case
some.data <- tibble(col1 = sample(letters[1:3], 500, replace = T),
col2 = sample(letters[1:3], 500, replace = T),
col3 = sample(letters[4:6], 500, replace = T),
col4 = sample(letters[4:6], 500, replace = T))
我的函数(简单地说)如下:
cross_table <- function(data = NULL, list1 = NULL, list2 = NULL){
for(l1 in list1){
for(l2 in list2){
data.out <- data %>%
count(l1, l2) %>%
spread(l2, n, fill = 0, drop = FALSE)
print(data.out) #Just to show it works. I want to use 'data.out' object later on
}
}
}
我想使用这样的函数(不将列的名称作为字符串)
some.data %>%
cross_table(list1 = list(col1, col2), list2 = list(col3, col4))
答案 0 :(得分:3)
vars()
函数在这里很合适。您可以在函数参数中使用它代替list()
。我看到了一个示例in this SO answer,它很容易扩展到您的情况。
加上循环中的一些tidyeval如下所示:
cross_table <- function(data = NULL, list1 = NULL, list2 = NULL){
for(l1 in list1){
for(l2 in list2){
l1 = enquo(l1)
l2 = enquo(l2)
data.out <- data %>%
count(!!l1, !!l2) %>%
spread(!!l2, n, fill = 0, drop = FALSE)
print(data.out)
}
}
}
some.data %>%
cross_table(list1 = vars(col1, col2), list2 = vars(col3, col4))
# A tibble: 3 x 4
col1 d e f
<chr> <dbl> <dbl> <dbl>
1 a 58 61 53
2 b 38 59 47
3 c 65 59 60
# A tibble: 3 x 4
col1 d e f
<chr> <dbl> <dbl> <dbl>
1 a 53 61 58
2 b 44 47 53
3 c 56 62 66
# A tibble: 3 x 4
col2 d e f
<chr> <dbl> <dbl> <dbl>
1 a 55 60 51
2 b 57 67 56
3 c 49 52 53
# A tibble: 3 x 4
col2 d e f
<chr> <dbl> <dbl> <dbl>
1 a 51 56 59
2 b 63 55 62
3 c 39 59 56
您还可以使用alist()
代替list()
(看起来像I learned at one point,但此后却被忘了:-D)。