我正在将我的pandas操作迁移到dask。当我使用熊猫时,以下行成功运作:
triggers = df.triggers.str.get_dummies(',')
。它将字符串拆分为逗号,然后将它们作为虚拟变量。
例如,如果df.triggers
有三行:
["a, b, c",
"a",
"b, c"]
这将输出值:
a | b | c
1 | 1 | 1
1 | 0 | 0
0 | 1 | 1
但是,我无法在dask中使用相同的命令并获取错误AttributeError: get_dummies
。当我尝试使用dd.get_dummies
时,它会要求我对字符串进行分类。但是,每个字符串只能在>>之后用逗号分隔字符串。
有关如何解决这个问题的想法吗?