考虑以下数据集:
|Column 1|Category_list|
1| a | X |
2| b | X,Y |
3| c | X,Y,Z |
4| d | Q |
5| e | W,Q |
6| f | D |
我想将Category_list转换为虚拟列,其中每个行值都有自己的列,即
|Column 1|Category_list| X | Y | Z | Q | W |
1| a | X | 1 | 0 | 0 | 0 | 0 |
2| b | X,Y | 1 | 1 | 0 | 0 | 0 |
3| c | X,Y,Z | 1 | 1 | 1 | 0 | 0 |
4| d | Q | 0 | 0 | 0 | 1 | 0 |
5| e | W,Q | 0 | 0 | 0 | 1 | 1 |
6| f | Q | 0 | 0 | 0 | 1 | 0 |
我尝试将每个唯一行都设置为虚拟列,以期稍后将它们拆分,但是我遇到了Error: cannot allocate vector of size 13.3 Gb
关于如何执行此操作的任何想法?