我有一个类似于此的数据框。
age gender edu income
15 m MS <=50
16 f BS >50
17 m BS <=50
由于这是一个二元问题,我希望所有&lt; = 50K值为0且&gt; 50K为1.我已经尝试过替换方法而且它没有做任何东西。
data["income"].replace(["<=50K"], "0", inplace = True)
data["income"].replace( to_replace = "<=50K"], value = 0, inplace = True)
答案 0 :(得分:4)
IIUC:
data['income'] = (data.income == '>50').astype(int)
输出:
age gender edu income
0 15 m MS 0
1 16 f BS 1
2 17 m BS 0
答案 1 :(得分:2)
使用map
df.income=df.income.map({'<=50':0,'>50':1})
df
Out[328]:
age gender edu income
0 15 m MS 0
1 16 f BS 1
2 17 m BS 0