如何用python中的另一个值替换pandas数据帧中的Object

时间:2018-05-18 03:55:24

标签: python pandas machine-learning

我有一个类似于此的数据框。

age gender edu income
15    m     MS   <=50
16    f     BS   >50
17    m     BS   <=50

由于这是一个二元问题,我希望所有&lt; = 50K值为0且&gt; 50K为1.我已经尝试过替换方法而且它没有做任何东西。

data["income"].replace(["<=50K"], "0", inplace = True)

data["income"].replace( to_replace = "<=50K"], value = 0, inplace = True)

2 个答案:

答案 0 :(得分:4)

IIUC:

data['income'] = (data.income == '>50').astype(int)

输出:

   age gender edu  income
0   15      m  MS       0
1   16      f  BS       1
2   17      m  BS       0

答案 1 :(得分:2)

使用map

df.income=df.income.map({'<=50':0,'>50':1})
df
Out[328]: 
   age gender edu  income
0   15      m  MS       0
1   16      f  BS       1
2   17      m  BS       0