如果我将数据框构造为
# constructing df
a <- c(rep("A", 3), rep("B", 3), rep("A",2))
b <- c(1,1,2,4,1,1,2,2)
#c <- c("ir", "ir", "br", "ir", "us", "us", "ir", "br")
c <- c(1, 2, 3, 4, 4, 4, 4, 5)
df <- data.frame(a,b,c)
我可以通过以下方式汇总:
df_red <- aggregate(list(track = c), df[,c("a", "b")], '[')
将这一点分解回原来的最佳方法是什么?
换句话说,我该如何转换它:
a b track
1 A 1 1, 2
2 B 1 4, 4
3 A 2 3, 4, 5
4 B 4 4
到此:
a b c
1 A 1 1
2 A 1 2
3 A 2 3
4 B 4 4
5 B 1 4
6 B 1 4
7 A 2 4
8 A 2 5
答案 0 :(得分:3)
1)不当尝试unnest
,如下所示:
library(tidyr)
df_red %>% unnest
或
unnest(df_red)
2)base 以下是基本解决方案:
do.call(rbind, do.call(Map, c(data.frame, df_red)))
3)separate_rows 另请注意,如果您想要聚合成一个字符串而不是一个向量,我们可以使用这一对:
library(tidyr)
ag_s <- aggregate(list(track = c), df[c("a", "b")], toString)
ag_s %>% separate_rows(track)