我正在将一个cvs文件导入到pandas中,当我这样做时,前几个名称被正确编码,然后在重音符号后面转回符号。这是一个非常大的文件,有近200个名字。我有什么办法可以解决这个问题。
import sys
import codecs
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
#%matplotlib inline
from matplotlib.pylab import rcParams
sys.stdout = codecs.getwriter( "ISO-8859-1" )( sys.stdout.detach() )
rcParams['figure.figsize'] = 15, 6
data = pd.read_csv('IndNames.csv', encoding='ISO-8859-1')
pd.get_option("display.max_rows")
pd.set_option('expand_frame_repr', False)
pd.set_option('display.height', 500)
data.align(data, axis=1)
print(data.head(n=182))
Ex: José
José
编辑:ftfy不适用于数据帧
Edit1:当我将它保存到csv文件时,我无法弄清楚问题一切正常然后当我使用pd.read_csv
再次使用它时它是未编码的。
答案 0 :(得分:0)
sys.stdout = codecs.getwriter( "UTF-8" )( sys.stdout.detach() )
简单的修复,我不知道为什么它在我尝试之前没有工作但是这样做了诀窍