从具有多个值的列中创建虚拟变量

时间:2020-10-07 04:39:11

标签: dask

我的问题类似于该线程Create dummies from column with multiple values in pandas

目标:我想在下面使用dask产生类似的结果

在熊猫里

import pandas as pd
df = pd.DataFrame({'fruit': ['Banana, , Apple, Dragon Fruit,,,', 'Kiwi,', 'Lemon, Apple, Banana', ',']})
df['fruit'].str.get_dummies(sep=',')

将输出以下内容:

          Apple  Banana Dragon Fruit    Banana  Kiwi    Lemon
0     1      1        0            1         1     0        0
1     0      0        0            0         0     1        0
2     0      1        1            0         0     0        1
3     0      0        0            0         0     0        0
上面的

get_dummies()类型为

现在的问题是,没有与dask等效的

的get_dummies()

如何使用dask解决我的问题?

0 个答案:

没有答案