从excel文件读取数据后,使用python通过pandas进行数据清理

时间:2017-07-26 14:09:12

标签: python excel pandas data-cleaning

enter image description here

你可以在这张照片中看到。在原始数据中,有些记录的末尾有数字。它们会给数据分析带来很多不便。无论有多少记录有“数字”结尾,是否有任何方法或功能可以有效地处理这个问题。

另外,直接将这个excel文件读取到pd.Dataframe就是这样,我想有效地摆脱这些数字('2','3','4'......)。

China2

中国,香港特别行政区3

中国,澳门特别行政区4

1 个答案:

答案 0 :(得分:0)

为什么不删除这些数字:

df.Country = df.Country.str.replace("\d+$", "")