从R中的Reshape2了解Dcast

时间:2016-02-25 22:30:58

标签: r reshape2


关于融化数据我有一个问题,任何关于如何做到这一点的想法都会非常有用 例如:我有head(dataset)喜欢左

 KLIENDIKAARDINR                 TSEKK_ID        KPV   KPV_ID     KELL
1 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
2 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
3 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
4 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
5 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
6 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
       Categories D_INVENTTABLE_PRODUCT_ID  KL_ID
1      cat1                    103573   538151
2      cat2                   119186    538151
3      cat3                   103573    538154
4      cat5                    99298    538151
5      cat2                   116390    538152
6      cat2                   107954    538151
 where there are 78 different barcodes cat1..cat78 

和另一个df只包含像

这样的唯一KL_ID
head(n,2)
KL_ID  margin_total
10     996.1263
558151 122.337 
558152 328.323
 ...   ....

现在以这种格式重塑数据:

KL_ID  margin_total cat1 cat2 cat3 cat4 cat5 ...cat78
  10     996.1263   0    0    1     1    0
  558151 122.337    1    1    0     0    1        
  558152 328.323    0    1    0     0    1

这里的逻辑是将cat1..78作为列,并用二进制值填充它们,如果存在,则不管它们出现在每个KL_ID的次数,如果存在,则如果该类别不存在,则为0 KL_ID。
对于我们如何使用重塑的dcast来申请这方面的任何帮助都将不胜感激。
谢谢

0 个答案:

没有答案