我有一个.dta格式的数据表,我已经使用Pandas读入了python。数据主要是分类数据类型,我想用可以与机器学习一起使用的数值数据替换列,例如布尔值(1/0)或代码。麻烦的是我无法直接替换数据,因为它不允许我更改类别,除非我添加它们。
我尝试过使用pd.get_dummies(),但它一直会返回错误:
TypeError:' columns'是此函数的无效关键字参数
print(pd.get_dummies(feature).head(), columns=['smkevr', 'cignow', 'dnnow',
'dnever', 'complst'])
是否有一种简单的方法可以使用基于值的数字代码替换此数据(例如'不适用' = 0)?
答案 0 :(得分:0)
我是按照以下方式做的:
df_dumm = pd.get_dummies(feature).head()
df_dumm.columns = ['smkevr', 'cignow', 'dnnow',
'dnever', 'complst']
print (df_dumm.head())