我有一个pandas数据框,其中一些字段包含中文字符。我使用以下代码:
df = pd.read_csv('original.csv', encoding='utf-8')
df.to_csv('saved.csv')
然后我使用excel或文本编辑器打开saved.csv。所有汉字都成为垃圾字符。但是,我可以加载保存的文件并正确显示中文。
df = pd.read_csv('saved.csv')
df.head() # Chinese characters are properly displayed.
有谁知道如何解决这个问题?
答案 0 :(得分:4)
尝试以下操作:
df = pd.read_csv('original.csv', encoding='utf-8')
df.to_csv('saved.csv', encoding='utf_8_sig')
utf-8
失败时它对我有用
答案 1 :(得分:2)
问题在于excel的编码。
要解决此问题,我首先使用sublime打开csv,然后使用BOM(>字节顺序标记)将文件>保存为编码 - > UTF-8。
现在excel能够毫无问题地打开csv!