如何删除特殊字符

时间:2019-04-04 09:05:49

标签: python python-3.x pandas dataframe

我从https://stats.oecd.org/Index.aspx?DataSetCode=MEI_ARCHIVE复制了文本“修订分析数据集-年度经济指标”,并导出到CSV文件,但是在csv文件中显示了一些无效字符“ –”。

import pandas as pd
df = pd.DataFrame(['Revisions Analysis Dataset – Infra-annual Economic Indicators'])
df.to_csv(r"D:\Sunil_Work\temp.csv")

在导出的文件中发现的特殊字符如下:

0,Revisions Analysis Dataset – Infra-annual Economic Indicators

我已经包含了 encoding ='utf-8',但是没有运气,请提供帮助。

df.to_csv(r"D:\Sunil_Work\temp.csv", encoding = 'utf-8')

1 个答案:

答案 0 :(得分:2)

有时utf-8不适用于所有类型的编码。

尝试以下方法:

  1. encoding=utf-8-sig
  2. encoding=utf-16