标签: python scikit-learn data-mining categorical-data
如何仅将一个热编码应用于具有数字分类值的列。我想修改相同的数据帧。 Dataframe具有字符串值的其他功能。感谢
答案 0 :(得分:1)
如果您有数据帧,可以使用pd.get_dummies(...)方法。
pd.get_dummies(...)
>>> import pandas as pd >>> s = pd.Series(list('abca')) >>> pd.get_dummies(s) a b c 0 1 0 0 1 0 1 0 2 0 0 1 3 1 0 0
您可以查看Docs了解更多信息。
还有一个可选的columns参数,它将列表中的列转换为虚拟对象。
columns
Here是一个关于如何获取列和类型列表的SO问题。