我有一个熊猫数据框,其中的“值”列具有逗号分隔的值:
Row|Values
1|1,2,3,8
2|1,4
我想基于CSV创建列,并分配一个布尔值,指示该行是否具有该值,如下所示:
Row|1,2,3,4,8
1|true,true,true,false,true
2|true,false,false,true,false
我该怎么做?
预先感谢
答案 0 :(得分:4)
只需使用get_dummies
,在此处检查链接,然后astype(bool)
就会将1更改为True,0更改为False
df.set_index('Row')['Values'].str.get_dummies(',').astype(bool)
Out[318]:
1 2 3 4 8
Row
1 True True True False True
2 True False False True False