scikit-有什么方法可以对列中的多个选择进行向量化?

时间:2018-10-31 10:52:11

标签: python pandas scikit-learn

df = pd.DataFrame([[1,'a'],[2,'a,b'],[3,'b']], columns=['col1', 'col2'])

我可以编写使用pd.Series.str.get_dummies(sep=',')来处理列中的多个值,但是这是次理想的,因为它不包含适用于训练数据和适用于测试数据的适合值列表。

>>> df['col2'].str.get_dummies(sep=',')
   a  b
0  1  0
1  1  1
2  0  1

scikit.learn(或另一个软件包)中是否有一个函数可以处理

中的多项选择列

0 个答案:

没有答案