当我查看数据框中列中的值时,我可以看到由于用户数据输入错误,输入的类别不正确。
对于我的数据帧,我使用此代码:
df['column_name'].value_counts()
输出:
Targeted 523534
targeted 1
story 25425
story 2
multiple 2524543
对于故事,我猜有空间?
我正在尝试用Targeted替换目标。
df['column_name'].replace("targeted","Targeted")
但是没有发生任何事情,我仍然得到相同的价值计数。
答案 0 :(得分:3)
是的,似乎有结束白色空间的开始。
首先需要str.strip
,然后需要Series.replace
或Series.str.replace
:
df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted")
df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted")
另一种可能的解决方案是将所有字符转换为小写:
df['column_name'] = df['column_name'].str.strip().str.lower()