Python pandas替换列中的值

时间:2017-02-08 19:06:49

标签: python pandas dataframe replace

当我查看数据框中列中的值时,我可以看到由于用户数据输入错误,输入的类别不正确。

对于我的数据帧,我使用此代码:

df['column_name'].value_counts()

输出:

 Targeted    523534
 targeted    1
 story       25425
 story       2
 multiple    2524543

对于故事,我猜有空间?

我正在尝试用Targeted替换目标。

df['column_name'].replace("targeted","Targeted")

但是没有发生任何事情,我仍然得到相同的价值计数。

1 个答案:

答案 0 :(得分:3)

是的,似乎有结束白色空间的开始。

首先需要str.strip,然后需要Series.replaceSeries.str.replace

df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted")
df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted")

另一种可能的解决方案是将所有字符转换为小写:

df['column_name'] = df['column_name'].str.strip().str.lower()