删除pandas数据帧中的特殊字符

时间:2017-08-24 22:16:22

标签: python python-3.x pandas dataframe jupyter-notebook

我找到了关于如何做到这一点的信息,但没有任何对我有用。我正在尝试替换特殊字符'ð'。我从csv文件导入了我的数据,我使用encoding ='latin1',否则我不断收到错误。然而,一个简单的DF ['Column']。str.replace('ð','')不会起作用。我也尝试解码并使用该字符的十六进制值,这是在另一篇文章中推荐的,但这仍然不适合我。非常感谢帮助,如果有必要,我愿意发布代码。

1 个答案:

答案 0 :(得分:6)

致电str.encode,然后致电str.decode

df.YourCol.str.encode('utf-8').str.decode('ascii', 'ignore')

如果要对多个列执行此操作,可以切片并调用df.applymap

df[col_list].applymap(lambda x: x.encode('utf-8').decode('ascii', 'ignore'))

请记住,这些操作并非就地。因此,您必须将这些列分配回正确的位置。