关于融化数据我有一个问题,任何关于如何做到这一点的想法都会非常有用
例如:我有head(dataset)
喜欢左
KLIENDIKAARDINR TSEKK_ID KPV KPV_ID KELL
1 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
2 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
3 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
4 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
5 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
6 9233660006737480 201401250001057986117632 2014.01.25 20140125 18:33:19
Categories D_INVENTTABLE_PRODUCT_ID KL_ID
1 cat1 103573 538151
2 cat2 119186 538151
3 cat3 103573 538154
4 cat5 99298 538151
5 cat2 116390 538152
6 cat2 107954 538151
where there are 78 different barcodes cat1..cat78
和另一个df只包含像
这样的唯一KL_IDhead(n,2)
KL_ID margin_total
10 996.1263
558151 122.337
558152 328.323
... ....
现在以这种格式重塑数据:
KL_ID margin_total cat1 cat2 cat3 cat4 cat5 ...cat78
10 996.1263 0 0 1 1 0
558151 122.337 1 1 0 0 1
558152 328.323 0 1 0 0 1
这里的逻辑是将cat1..78作为列,并用二进制值填充它们,如果存在,则不管它们出现在每个KL_ID的次数,如果存在,则如果该类别不存在,则为0 KL_ID。
对于我们如何使用重塑的dcast来申请这方面的任何帮助都将不胜感激。
谢谢