如何将tibble列中的向量提取到同一个tibble中的多个列?

时间:2017-12-07 10:07:54

标签: r vector dplyr tibble

以下代码在最后一列中生成一个长度为6的向量,从该列我想在我的tibble中提取6个新列。

require(tidyverse)
require(purrrlyr)
# this function will return a vector of the same length (6) for each group
fun=function(X,Y){
   mycut<-cut(X,breaks=seq(50,350,by=50),right=FALSE)
   v<-tapply(Y,mycut,sum)
   return(v)
}
# use the previous function to count gears per class of hp
mtcars %>%
    group_by(cyl)  %>%   
    by_slice(~fun(.x$hp,.x$gear)) %>%
    rename(cut=.out)

这里我的列切割中有一个向量

# tibble [3 x 2]
     cyl       cut
  <fctr>    <list>
1      4 <dbl [6]>
2      6 <dbl [6]>
3      8 <dbl [6]>

我需要从这个向量传递给像这样的表的什么命令?

cyl  [50,100) [100,150) [150,200) [200,250) [250,300) [300,350) 
   4     36         9        NA        NA        NA        NA 
   ...

unnest不起作用。我是否必须使用by_row或者是否有更简单的答案?

2 个答案:

答案 0 :(得分:1)

我们需要获得&#39; cut&#39;的names。变量为新列,然后执行spread重新变换为&#39; wide&#39; unnest list元素之后的格式

mtcars %>%
   group_by(cyl)  %>%   
   by_slice(~fun(.x$hp,.x$gear)) %>%
   rename(cut=.out) %>%
   mutate(Names = map(cut, ~factor(names(.x), levels = names(.x)))) %>%
   unnest %>%
   spread(Names, cut)
# A tibble: 3 x 7
#    cyl `[50,100)` `[100,150)` `[150,200)` `[200,250)` `[250,300)` `[300,350)`
#*  <dbl>      <dbl>       <dbl>       <dbl>       <dbl>       <dbl>       <dbl>
#1     4         36           9          NA          NA          NA          NA
#2     6         NA          22           5          NA          NA          NA
#3     8         NA          NA          21          15           5           5

答案 1 :(得分:1)

我会建议另一种方法。您可以使用以下代码,而不是使用已弃用的by_slice()函数(现在在purrrlyr包中重复使用):

mtcars %>% 
  split(.$cyl) %>% 
  map(~fun(.x$hp,.x$gear)) %>% 
  do.call(rbind, .)

其中提供以下输出

  [50,100) [100,150) [150,200) [200,250) [250,300) [300,350)
4       36         9        NA        NA        NA        NA
6       NA        22         5        NA        NA        NA
8       NA        NA        21        15         5         5