使用Pandas中的代码替换分类数据列的最简单方法是什么?

时间:2017-06-14 12:01:02

标签: python pandas

我有一个.dta格式的数据表,我已经使用Pandas读入了python。数据主要是分类数据类型,我想用可以与机器学习一起使用的数值数据替换列,例如布尔值(1/0)或代码。麻烦的是我无法直接替换数据,因为它不允许我更改类别,除非我添加它们。

我尝试过使用pd.get_dummies(),但它一直会返回错误:
TypeError:' columns'是此函数的无效关键字参数

print(pd.get_dummies(feature).head(), columns=['smkevr', 'cignow', 'dnnow', 
                                               'dnever', 'complst'])

是否有一种简单的方法可以使用基于值的数字代码替换此数据(例如'不适用' = 0)?

1 个答案:

答案 0 :(得分:0)

我是按照以下方式做的:

df_dumm = pd.get_dummies(feature).head()
df_dumm.columns = ['smkevr', 'cignow', 'dnnow', 
                   'dnever', 'complst']
print (df_dumm.head())