将Column中的CSV值转换为具有二进制答案的单独列

时间:2017-06-29 20:51:15

标签: python pandas data-science

我有一些看起来像这样的数据

ColumnName
value 1, value 2
value 1, value 3

我想删除此列,而是替换为每个值的列,就像这样。

value 1 value 2 value 3
1       1       0
1       0       1

是否有可用的库/函数调用来处理这个问题?我在R中看到有一个名为Csplit_e

的splitstackshape库

1 个答案:

答案 0 :(得分:1)

尝试:

import pandas as pd


df = pd.DataFrame({'ColumnName': ['value 1, value 2', 'value 1, value 3']})


#          ColumnName
# 0  value 1, value 2
# 1  value 1, value 3

pd.get_dummies(df.ColumnName.str.split(',', expand=True), prefix='', prefix_sep='')


#    value 1   value 2   value 3
# 0        1         1         0
# 1        1         0         1

我希望这会有所帮助。