在里面使用dplyr函数apply

时间:2018-02-02 18:03:42

标签: r dplyr apply

我想在apply中使用dplyr函数,使用矩阵(BRCK)的每个元素,这是一个数据帧矩阵。 我试过这样的事情:

apply(BRCK, c(1,2), function(x) dplyr::select(x, dplyr::contains("_01_"), 1) %>%
                                dplyr::filter((month(`BRCK[[la, lo]]`) == 1)) %>% 
                                dplyr::select(-contains("BRCK")) 

但它返回

Error: Variable context not set 

追溯:

13. stop(cnd) 
12. abort("Variable context not set") 
11. cur_vars_env$selected %||% abort("Variable context not set") 
10. current_vars() 
9. tolower(vars) 
8. dplyr::contains("_01_") 
7. select.list(x, dplyr::contains("_01_"), 1) 
6. dplyr::select(x, dplyr::contains("_01_"), 1) 
5. eval(lhs, parent, parent) 
4. eval(lhs, parent, parent) 
3. dplyr::select(x, dplyr::contains("_01_"), 1) %>% dplyr::filter(x, 
(month(`BRCK[[la, lo]]`) == 1)) %>% dplyr::select(x, -contains("BRCK")) 
2. FUN(newX[, i], ...) 
1. apply(BRCK, c(1, 2), function(x) dplyr::select(x, dplyr::contains("_01_"), 1) %>% dplyr::filter(x, (month(`BRCK[[la, lo]]`) == 1)) %>% 
dplyr::select(x, -contains("BRCK"))) 

BRCK是一个非常大的对象,它适用于循环,但我试图用apply函数替换它们。

2 个答案:

答案 0 :(得分:3)

使用apply,x作为列表传递给函数,dplyr只处理数据帧。

apply(BRCK, c(1,2), is.data.frame)
      [,1]  [,2]  [,3]
[1,] FALSE FALSE FALSE
[2,] FALSE FALSE FALSE
[3,] FALSE FALSE FALSE

but :

apply(BRCK, c(1,2), function(x) is.data.frame(x[[1]]))
     [,1] [,2] [,3]
[1,] TRUE TRUE TRUE
[2,] TRUE TRUE TRUE
[3,] TRUE TRUE TRUE

so : 

library(tidyverse)
apply(BRCK, c(1,2), 
      function(x) {
        x[[1]] %>%
          dplyr::select(dplyr::contains("_01_"), 1) %>%
          dplyr::filter(lubridate::month(`BRCK[[la, lo]]`) == 1) %>% 
          dplyr::select(-contains("BRCK")) 
      }
)

答案 1 :(得分:2)

一个问题是循环中的每个元素都是单个数据帧的列表,而不是实际的数据帧。比较:

apply(BRCK, c(1,2), function(x) {
  class(x)
}) 

     [,1]   [,2]   [,3]  
[1,] "list" "list" "list"
[2,] "list" "list" "list"
[3,] "list" "list" "list"

apply(BRCK, c(1,2), function(x) {
  class(x[[1]])
}) 

     [,1]         [,2]         [,3]        
[1,] "data.frame" "data.frame" "data.frame"
[2,] "data.frame" "data.frame" "data.frame"
[3,] "data.frame" "data.frame" "data.frame"

我建议不要使用apply循环(而是在索引上使用lapply),因为应用子集对象并修改它们的方式没有很好地记录。

我还建议不要将data.frame存储在矩阵中。您可以将它们存储在列表中,并设置矩阵索引隐含的元数据的属性。