在sklearn中应用一个热编码

时间:2017-01-20 00:23:47

标签: python scikit-learn data-mining categorical-data

如何仅将一个热编码应用于具有数字分类值的列。我想修改相同的数据帧。 Dataframe具有字符串值的其他功能。感谢

1 个答案:

答案 0 :(得分:1)

如果您有数据帧,可以使用pd.get_dummies(...)方法。

>>> import pandas as pd
>>> s = pd.Series(list('abca'))

>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0

您可以查看Docs了解更多信息。

还有一个可选的columns参数,它将列表中的列转换为虚拟对象。

Here是一个关于如何获取列和类型列表的SO问题。