如何将组分配给较大的组dpylr

时间:2019-12-12 14:26:28

标签: r dplyr data-munging

我想将组分配给更大的组,以便将它们分配给核心进行处理。我有16个核心。到目前为止,这是我所拥有的

test<-data_extract%>%group_by(group_id)%>%sample_n(16,replace = TRUE)

这需要从每个组中取出16个订书钉。

这是我希望最终产品的外观(带有两个集群)的一个示例,我真正想要的是使相同的组ID与一定数量的集群属于同一集群。

________________________________
balance   | group_id |  cluster|
454452    | a        |  1      |
5450441   | a        |  1      |
5444531   | b        |  1      |
5404051   | b        |  1      |
5404501   | b        |  1      |
5404041   | b        |  1      |
544251    | b        |  1      |
254252    | b        |  1      |
541254    | c        |  2      |
54123254  | d        |  1      |
542541    | d        |  1      |
5442341   | e        |  2      |
541       | f        |  1      |
________________________________

1 个答案:

答案 0 :(得分:0)

test <-data%>%group_by(group_id)%>%变异(group = sample(1:16,1))