使用dplyr

时间:2017-03-03 15:24:38

标签: r dplyr lazy-evaluation

我想用dplyr函数编写一个函数来输出z中每个元素有多少个唯一元组(z,y)。该功能看起来像这样

library(tidyverse)

data <- data_frame(z = rep(c('a', 'b'), 50), 
       y = sample(letters[13:18], size = 100, T))

foo1 <- function(data, x, n){

  library(lazyeval)
  data %>%
    group_by_(lazy(n, x)) %>%
    filter(row_number() == 1) %>%
    ungroup() %>% 
    group_by_(lazy(x)) %>%
    summarise(nr_x = n()) %>%
    arrange(desc(nr_x))

}

foo1(data, x = z, n = y)

但是我收到以下错误:

Error in as.lazy_dots(list(...)) : object 'z' not found 

这个更简单的功能,看起来与之前非常相似,效果很好。

foo <- function(data, x, n){

  library(lazyeval)
  data %>%
    group_by_(lazy(n, x)) %>%
    summarise(n = n())
}

任何想法如何解决?

1 个答案:

答案 0 :(得分:1)

8个月后再回到这个问题,我没有收到我在运行foo1时遇到的错误。不知道为什么。

但我决定使用最新的tidyeval方法来解决这个问题。以下对我来说很好:

library(tidyverse)

data <- data_frame(z = rep(c('a', 'b'), 50), 
   y = sample(letters[13:18], size = 100, T))

foo_tidyeval <- function(data, x, n){
  x <- enquo(x)
  n <- enquo(n)

  data %>%
    group_by(!!n, !!x) %>%
    filter(row_number() == 1) %>%
    ungroup() %>% 
    group_by_(x) %>%
    summarise(nr_x = n()) %>%
    arrange(desc(nr_x))
}

foo_tidyeval(data, x = z, n = y)