我的CSV只有一半是经过编码的

时间:2017-05-05 18:28:19

标签: python csv encoding

我正在将一个cvs文件导入到pandas中,当我这样做时,前几个名称被正确编码,然后在重音符号后面转回符号。这是一个非常大的文件,有近200个名字。我有什么办法可以解决这个问题。

import sys
import codecs
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
#%matplotlib inline
from matplotlib.pylab import rcParams
sys.stdout = codecs.getwriter( "ISO-8859-1" )( sys.stdout.detach() )
rcParams['figure.figsize'] = 15, 6


data = pd.read_csv('IndNames.csv', encoding='ISO-8859-1')
pd.get_option("display.max_rows")
pd.set_option('expand_frame_repr', False)
pd.set_option('display.height', 500)
data.align(data, axis=1)
print(data.head(n=182))

Ex: José
    José 

编辑:ftfy不适用于数据帧

Edit1:当我将它保存到csv文件时,我无法弄清楚问题一切正常然后当我使用pd.read_csv再次使用它时它是未编码的。

1 个答案:

答案 0 :(得分:0)

sys.stdout = codecs.getwriter( "UTF-8" )( sys.stdout.detach() )

简单的修复,我不知道为什么它在我尝试之前没有工作但是这样做了诀窍