我正在尝试阅读包含外国字符的csv文件(目前法语口音,但将来也是俄语)。有没有办法在不删除/替换外来字符的情况下读取这些csv?
每当我尝试:
pd.read_csv('filename.csv', encoding='utf-8')
,无法找到任何列。
所以我尝试了这个:
with codecs.open('filename.csv', 'r') as f:
for line in f.readlines():
print line
它只为某些行输出[Decode error - output not utf-8]
(具有áéí等的行)
我也尝试过以下建议来获取文件的编码,当我用正确的编码读取文件时,我得到UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 0: ordinal not in range(128)
或类似的东西!
有什么想法吗? 提前致谢