数据帧中的Unnest向量,但添加列表索引列

时间:2017-10-13 02:07:55

标签: r tidyr tidyverse

说我有tibble,例如:

tibble(x=22:23, y=list(4:6,4:7))

# A tibble: 2 × 2
      x         y
  <int>    <list>
1    22 <int [3]>
2    23 <int [4]>

我想通过取消列表(例如使用tibble)将其转换为新的更大unnest,这会给我一个7行的元素。但是,我想要添加一个新列,告诉我,对于取消后连续的给定y值,该y值的索引在列表形式时是什么。以下是执行此操作后的上述内容:

# A tibble: 7 × 2
      x     y    index
  <int> <int>    <int>
1    22     4        1
2    22     5        2
3    22     6        3
4    23     4        1
5    23     5        2
6    23     6        3
7    23     7        4

4 个答案:

答案 0 :(得分:4)

您可以map超过y列,并在取消之前绑定每个元素的索引:

df %>% 
    mutate(y = map(y, ~ data.frame(y=.x, index=seq_along(.x)))) %>% 
    unnest()

# A tibble: 7 x 3
#      x     y index
#  <int> <int> <int>
#1    22     4     1
#2    22     5     2
#3    22     6     3
#4    23     4     1
#5    23     5     2
#6    23     6     3
#7    23     7     4

答案 1 :(得分:3)

以下是lengths

的另一个版本
df %>%
    mutate(index = lengths(y)) %>%
    unnest(y) %>%
    mutate(index = sequence(unique(index)))
# A tibble: 7 x 3
#     x index     y
#  <int> <int> <int>
#1    22     1     4
#2    22     2     5
#3    22     3     6
#4    23     1     4
#5    23     2     5
#6    23     3     6
#7    23     4     7

答案 2 :(得分:2)

起诉unnestgroup_by

library(tidyr)
library(dplyr)
df %>%
  unnest(y)%>%group_by(x)%>%mutate(index=row_number())

# A tibble: 7 x 3
# Groups:   x [2]
      x     y index
  <int> <int> <int>
1    22     4     1
2    22     5     2
3    22     6     3
4    23     4     1
5    23     5     2
6    23     6     3
7    23     7     4

答案 3 :(得分:-1)

您还可以尝试rowwisedo

library(tidyverse)
tibble(x=22:23, y=list(4:6,4:7)) %>% 
    rowwise() %>% 
    do(tibble(x=.$x, y=unlist(.$y), index=1:length(.$y)))