df = pd.DataFrame([[1,'a'],[2,'a,b'],[3,'b']], columns=['col1', 'col2'])
我可以编写使用pd.Series.str.get_dummies(sep=',')
来处理列中的多个值,但是这是次理想的,因为它不包含适用于训练数据和适用于测试数据的适合值列表。
>>> df['col2'].str.get_dummies(sep=',')
a b
0 1 0
1 1 1
2 0 1
scikit.learn(或另一个软件包)中是否有一个函数可以处理
中的多项选择列