在tidyr的许多列中单独列出一列列表

时间:2017-07-26 13:19:03

标签: r tidyr

例如,我有一个这样整洁的数据框:

df <- tibble(id=1:2,
         ctn=list(list(a="x",b=1),
                  list(a="y",b=2)))
# A tibble: 2 x 2
     id        ctn
  <int>     <list>
1     1 <list [2]>
2     2 <list [2]>

我怎样才能将ctn列排除在右侧,以便数据框如下所示:

# A tibble: 2 x 3
     id     a     b
  <int> <chr> <dbl>
1     1     x     1
2     2     y     2

3 个答案:

答案 0 :(得分:7)

使用dplyrpurrr

df %>% 
  mutate(ctn = map(ctn, as_tibble)) %>%
  unnest()
# A tibble: 2 x 3
     id     a     b
  <int> <chr> <dbl>
1     1     x     1
2     2     y     2

答案 1 :(得分:2)

一个选项是

library(data.table)
setDT(df)[, unlist(ctn, recursive = FALSE), id]
#   id a b
#1:  1 x 1
#2:  2 y 2

tidyr

library(tidyverse)
df$ctn %>%
     setNames(., df$id) %>%
     bind_rows(., .id = 'id')
# A tibble: 2 x 3
#   id     a     b
#  <chr> <chr> <dbl>
#1     1     x     1
#2     2     y     2

答案 2 :(得分:0)

我们现在可以(dplyr 1.0.2 及更高版本)使用 rowwise() 以一种整洁的方式执行此操作:

df %>% rowwise() %>% mutate(as_tibble(ctn))
# A tibble: 2 x 4
# Rowwise: 
     id ctn              a         b
  <int> <list>           <chr> <dbl>
1     1 <named list [2]> x         1
2     2 <named list [2]> y         2

坚持使用 purrr 我们还可以:

df %>% mutate(map_dfr(ctn, as_tibble))
# A tibble: 2 x 4
     id ctn              a         b
  <int> <list>           <chr> <dbl>
1     1 <named list [2]> x         1
2     2 <named list [2]> y         2