熊猫不替换大型数据框中的字符

时间:2020-11-12 19:11:09

标签: python pandas

当我创建一个小的测试数据框时,此代码可以正常工作,但是在导入大型excel文件后尝试使用它时,它并不能替代字符。

import pandas as pd
df = pd.DataFrame({'A':[1,2,3],
                    'B':[4,5,6],
                    'C':['`f;','d:','sda`sd'],
                    'D':['s','d;','d;p`'],
                    'E':[5,3,6],
                    'F':[7,4,3]})
df.replace({'`':''}, regex=True)

结果符合预期:

    A   B   C   D   E   F
0   1   4   f;  s   5   7
1   2   5   d:  d;  3   4
2   3   6   sdasd   d;p 6   3

但是,当我加载较大的Excel文件时:

import pandas as pd
excel_file = f'C:\testfile.xlsx'
df = pd.read_excel(excel_file,sheet_name='Details', dtype=str)
df.iloc[20831].loc['Group Number']

结果:

'008513L-0005 `'

然后运行替换:

df.replace({'`':''}, regex=True)
df.iloc[20831].loc['Group Number']

结果:

'008513L-0005 `'

1 个答案:

答案 0 :(得分:1)

我们可以使用“字符串标点”功能解决您在自然语言处理方法中遇到的问题。

read -p

enter image description here