你可以在这张照片中看到。在原始数据中,有些记录的末尾有数字。它们会给数据分析带来很多不便。无论有多少记录有“数字”结尾,是否有任何方法或功能可以有效地处理这个问题。
另外,直接将这个excel文件读取到pd.Dataframe就是这样,我想有效地摆脱这些数字('2','3','4'......)。
China2
中国,香港特别行政区3
中国,澳门特别行政区4
答案 0 :(得分:0)
为什么不删除这些数字:
df.Country = df.Country.str.replace("\d+$", "")