将包含中文字符的pandas数据框保存到文件

时间:2017-04-10 10:51:49

标签: python pandas dataframe special-characters

我有一个pandas数据框,其中一些字段包含中文字符。我使用以下代码:

df = pd.read_csv('original.csv', encoding='utf-8')
df.to_csv('saved.csv')

然后我使用excel或文本编辑器打开saved.csv。所有汉字都成为垃圾字符。但是,我可以加载保存的文件并正确显示中文。

df = pd.read_csv('saved.csv')
df.head() # Chinese characters are properly displayed.

有谁知道如何解决这个问题?

2 个答案:

答案 0 :(得分:4)

尝试以下操作:

df = pd.read_csv('original.csv', encoding='utf-8')   
df.to_csv('saved.csv', encoding='utf_8_sig')

utf-8失败时它对我有用

答案 1 :(得分:2)

问题在于excel的编码。

要解决此问题,我首先使用sublime打开csv,然后使用BOM(>字节顺序标记)将文件>保存为编码 - > UTF-8。

现在excel能够毫无问题地打开csv!