我想将组分配给更大的组,以便将它们分配给核心进行处理。我有16个核心。到目前为止,这是我所拥有的
test<-data_extract%>%group_by(group_id)%>%sample_n(16,replace = TRUE)
这需要从每个组中取出16个订书钉。
这是我希望最终产品的外观(带有两个集群)的一个示例,我真正想要的是使相同的组ID与一定数量的集群属于同一集群。
________________________________
balance | group_id | cluster|
454452 | a | 1 |
5450441 | a | 1 |
5444531 | b | 1 |
5404051 | b | 1 |
5404501 | b | 1 |
5404041 | b | 1 |
544251 | b | 1 |
254252 | b | 1 |
541254 | c | 2 |
54123254 | d | 1 |
542541 | d | 1 |
5442341 | e | 2 |
541 | f | 1 |
________________________________
答案 0 :(得分:0)
test <-data%>%group_by(group_id)%>%变异(group = sample(1:16,1))