Dask get_dummies分裂

时间:2017-10-10 06:34:34

标签: python pandas dask

我正在将我的pandas操作迁移到dask。当我使用熊猫时,以下行成功运作: triggers = df.triggers.str.get_dummies(',')。它将字符串拆分为逗号,然后将它们作为虚拟变量。

例如,如果df.triggers有三行:

["a, b, c", 
 "a", 
 "b, c"]

这将输出值:

a | b | c
1 | 1 | 1
1 | 0 | 0
0 | 1 | 1

但是,我无法在dask中使用相同的命令并获取错误AttributeError: get_dummies。当我尝试使用dd.get_dummies时,它会要求我对字符串进行分类。但是,每个字符串只能在>之后用逗号分隔字符串

有关如何解决这个问题的想法吗?

0 个答案:

没有答案