特殊字符未编码熊猫

时间:2019-01-23 22:16:32

标签: python pandas utf-8 ascii special-characters

我正在尝试使用Pandas将多个字段连接在一起。我之前已经成功做到了。我的问题是在两列之间,我需要插入一个“”特殊字符。不管我尝试了什么,一旦将其导出到csv,它总是变成一个问号。

我尝试在excel和notepad ++中打开,无论我告诉程序什么是编码,两者都做同样的事情。

问题在于,我的数据集和脚本中还有其他特殊字符,但是它们的行为正常。

我尝试过:

  • 将特殊字符编码为utf-8
  • 将其转换为变量,然后将其编码为utf-8
  • 对最初在熊猫中打开的csv进行编码
  • 在导出时将csv写入新文件时对其进行编码
  • 仅填充特殊列 字符并将其与其余值连接起来

我想要的是这个

401 ‑ 403 RUE THOMAS LACHUTE魁北克J8H 4N7

我得到的是这样:

401? 403 RUE THOMAS LACHUTE魁北克J8H 4N7

dfFromCRM.loc[((dfFromCRM['Province']=='QUEBEC') & (dfFromCRM['Street Number From']!=0), 
['Address'])]= dfFromCRM['Street Number From'].map(str)  + 'à' +  concatonateQuebec

1 个答案:

答案 0 :(得分:-1)

如果要将数据帧转换为csv,请使用utf-8-sig作为编码。可能有效 dataframe.to_csv(filepath,encoding ='utf-8-sig',index = False)