我正在尝试调整数据集的格式。我的当前集合在两列中看起来像这样。第一列是“群集”,第二列“名称”包含每个群集中的值:
Cluster Name
A 1
A 2
A 3
B 4
B 5
C 2
C 6
C 7
我想要一个列表,即一列,其中第2列的所有值都列在单列中第1列的关联集群下:
Cluster A
1
2
3
Cluster B
4
5
Cluster C
2
6
7
在过去的几个小时里,我一直在尝试使用R和Excel而没有运气。有任何想法吗?
答案 0 :(得分:0)
使用tidyr::nest
的技巧:
library(dplyr)
library(tidyr)
df %>% mutate(Cluster = paste0("Cluster_",Cluster)) %>% nest(Name) %>% t %>% unlist %>% as.data.frame
# .
# 1 Cluster_A
# 2 1
# 3 2
# 4 3
# 5 Cluster_B
# 6 4
# 7 5
# 8 Cluster_C
# 9 2
# 10 6
# 11 7