当我创建一个小的测试数据框时,此代码可以正常工作,但是在导入大型excel文件后尝试使用它时,它并不能替代字符。
import pandas as pd
df = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6],
'C':['`f;','d:','sda`sd'],
'D':['s','d;','d;p`'],
'E':[5,3,6],
'F':[7,4,3]})
df.replace({'`':''}, regex=True)
结果符合预期:
A B C D E F
0 1 4 f; s 5 7
1 2 5 d: d; 3 4
2 3 6 sdasd d;p 6 3
但是,当我加载较大的Excel文件时:
import pandas as pd
excel_file = f'C:\testfile.xlsx'
df = pd.read_excel(excel_file,sheet_name='Details', dtype=str)
df.iloc[20831].loc['Group Number']
结果:
'008513L-0005 `'
然后运行替换:
df.replace({'`':''}, regex=True)
df.iloc[20831].loc['Group Number']
结果:
'008513L-0005 `'