如何从熊猫数据框中删除转义字符(反斜杠“\”)

时间:2021-06-07 05:06:07

标签: python-3.x pandas

我有一个包含转义字符反斜杠 - () 的数据框。我想从数据框中删除所有转义字符。

python 中是否有任何聪明的方法来删除转义字符并清理数据框。

我尝试了下面的代码

df['name']= df['name'].str.encode('utf-8').str.decode('unicode_escape')

这给了我如下错误

UnicodeDecodeError: 'unicodeescape' codec can't decode bytes in position 20-21: malformed \N character escape

我的样本df

name
ALTRAN CONSULTING & \NENGINEERING GMBH
NANOVO KERESKEDELMI KFT \KENYSZERTORLES ALATT
SCHLUESSELBAUER \TECHNOLOGY GMBH & CO KG
HIMOLLA \SERVICE GMBH
LINDAL \VENTIL GMBH
CBB \ALTALANOS IPARI SZOLGALTATO BT
FRIEB BUMAG \VERTRIEBS GMBH
FATIMEX TECHNOLOGIES KFT \VEGELSZAMOLAS ALATT \" \"FELSZAMOLAS ALATT
BACSKA \AGRAR IPARI ZARTKORUEN MUKODO RT
SAG DEUTSCHLAND GMBH\N

1 个答案:

答案 0 :(得分:1)

你可以试试replace -


>>> import pandas as pd                                                                               
>>> 
>>> val = [r"ALTRAN CONSULTING & \NENGINEERING GMBH",r"NANOVO KERESKEDELMI KFT \KENYSZERTORLES ALATT"]
>>> 
>>> d = {'name':val}                                                                               
>>> 
>>> df = pd.DataFrame(d)
>>> df['name'] = df['name'].replace(to_replace= r'\\', value= '', regex=True)
>>> df
                                           name
0         ALTRAN CONSULTING & NENGINEERING GMBH
1  NANOVO KERESKEDELMI KFT KENYSZERTORLES ALATT
>>>