如何分解由列表列表组成的数据框

时间:2017-07-18 16:52:17

标签: r dataframe aggregation

如果我将数据框构造为

# constructing df
a <- c(rep("A", 3), rep("B", 3), rep("A",2))
b <- c(1,1,2,4,1,1,2,2)
#c <- c("ir", "ir", "br", "ir", "us", "us", "ir", "br")
c <- c(1, 2, 3, 4, 4, 4, 4, 5)
df <- data.frame(a,b,c)

我可以通过以下方式汇总:

df_red <- aggregate(list(track = c), df[,c("a", "b")], '[')

将这一点分解回原来的最佳方法是什么?

换句话说,我该如何转换它:

  a b   track
1 A 1    1, 2
2 B 1    4, 4
3 A 2 3, 4, 5
4 B 4       4

到此:

  a b c
1 A 1 1
2 A 1 2
3 A 2 3
4 B 4 4
5 B 1 4
6 B 1 4
7 A 2 4
8 A 2 5

1 个答案:

答案 0 :(得分:3)

1)不当尝试unnest,如下所示:

library(tidyr)

df_red %>% unnest

unnest(df_red)

2)base 以下是基本解决方案:

do.call(rbind, do.call(Map, c(data.frame, df_red)))

3)separate_rows 另请注意,如果您想要聚合成一个字符串而不是一个向量,我们可以使用这一对:

library(tidyr)

ag_s <- aggregate(list(track = c), df[c("a", "b")], toString)

ag_s %>% separate_rows(track)