'mutate'以在R

时间:2019-02-26 04:05:21

标签: r dplyr processing-efficiency magrittr

这是R版本3.4.4问题

投票功能voteOnBase,带有2个参数并返回2个元素的列表:WINNERVOTE.COUNT。我想用它来将这两列添加到notVotedYet,这是一个小标题。以下代码正确运行。

 library(tidyverse)

 withVotes <- notVotedYet %>%
    group_by(BASE) %>%
    mutate(WINNER     = voteOnBase(BASE, CODES)[[1]],
           VOTE.COUNT = voteOnBase(BASE, CODES)[[2]])

但是,它在相同的输入上两次调用voteOnBase。如何消除多余的函数调用,但仍添加相同的两列?

2 个答案:

答案 0 :(得分:3)

没有一些示例数据和输出就不容易回答,但是我建议写voteOnBase()来返回小标题,而不是列表。然后,您可以将结果存储在列表列中,并使用unnest()创建列。

为了说明:这是一个函数square_it(),它与您的函数一样,带有2个参数并返回2个元素-但作为小标题中的列。

square_it <- function(x, y) {
  tibble(x = x^2, y = y^2)
}

我们可以使用iris数据集来传递参数。我们使用pmap()来指定变量和函数。列表列名为sq

iris %>% 
  as_tibble() %>% 
  mutate(sq = pmap(list(Sepal.Length, Sepal.Width), square_it))

# A tibble: 150 x 6
   Sepal.Length Sepal.Width Petal.Length Petal.Width Species sq              
          <dbl>       <dbl>        <dbl>       <dbl> <fct>   <list>          
 1          5.1         3.5          1.4         0.2 setosa  <tibble [1 x 2]>
 2          4.9         3            1.4         0.2 setosa  <tibble [1 x 2]>
 3          4.7         3.2          1.3         0.2 setosa  <tibble [1 x 2]>
 4          4.6         3.1          1.5         0.2 setosa  <tibble [1 x 2]>
 5          5           3.6          1.4         0.2 setosa  <tibble [1 x 2]>
 6          5.4         3.9          1.7         0.4 setosa  <tibble [1 x 2]>
 7          4.6         3.4          1.4         0.3 setosa  <tibble [1 x 2]>
 8          5           3.4          1.5         0.2 setosa  <tibble [1 x 2]>
 9          4.4         2.9          1.4         0.2 setosa  <tibble [1 x 2]>
10          4.9         3.1          1.5         0.1 setosa  <tibble [1 x 2]>
# ... with 140 more rows

只需在该代码中添加%>% unnest(sq),即可生成列xy

iris %>% 
  as_tibble() %>% 
  mutate(sq = pmap(list(Sepal.Length, Sepal.Width), square_it)) %>%
  unnest(sq)

# A tibble: 150 x 7
   Sepal.Length Sepal.Width Petal.Length Petal.Width Species     x     y
          <dbl>       <dbl>        <dbl>       <dbl> <fct>   <dbl> <dbl>
 1          5.1         3.5          1.4         0.2 setosa   26.0 12.2 
 2          4.9         3            1.4         0.2 setosa   24.0  9   
 3          4.7         3.2          1.3         0.2 setosa   22.1 10.2 
 4          4.6         3.1          1.5         0.2 setosa   21.2  9.61
 5          5           3.6          1.4         0.2 setosa   25   13.0 
 6          5.4         3.9          1.7         0.4 setosa   29.2 15.2 
 7          4.6         3.4          1.4         0.3 setosa   21.2 11.6 
 8          5           3.4          1.5         0.2 setosa   25   11.6 
 9          4.4         2.9          1.4         0.2 setosa   19.4  8.41
10          4.9         3.1          1.5         0.1 setosa   24.0  9.61
# ... with 140 more rows

答案 1 :(得分:1)

您可能要使用group_map

library(dplyr)
useless_dupes <- function(x){list(x1=x, x2=x)}

mtcars %>%
  group_by(cyl) %>%
  group_map(~as_tibble(useless_dupes(.$disp)))
#> # A tibble: 32 x 3
#> # Groups:   cyl [3]
#>      cyl    x1    x2
#>    <dbl> <dbl> <dbl>
#>  1     4 108   108  
#>  2     4 147.  147. 
#>  3     4 141.  141. 
#>  4     4  78.7  78.7
#>  5     4  75.7  75.7
#>  6     4  71.1  71.1
#>  7     4 120.  120. 
#>  8     4  79    79  
#>  9     4 120.  120. 
#> 10     4  95.1  95.1
#> # ... with 22 more rows