尝试将包含非ASCII字符的CSV文件导入数据框

时间:2019-05-27 11:44:09

标签: python csv dataframe import ascii

当尝试将csv文件导入到熊猫数据框中时,出现UnicodeEncodeError,因为csv中的某些字符无法由ascii编码。 csv在utf-8中原始编码。

我的代码:

df1 = pd.read_csv(r'‪F:\data\Housing.csv')

UnicodeEncodeError:'ascii'编解码器无法在位置0编码字符'\ u202a':序数不在范围内(128)

现在,我已经尝试了一些在stackoverflow上发布的建议来解决此问题,但是,到目前为止还没有任何效果。

例如,我将csv文件保存为ascii编码,并尝试使用open命令,希望可以从那里到数据帧:

open('‪F:\data\Housing.csv', mode='r', encoding='ascii', errors='replace')

但是,无论我使用'replace'还是'ignore'错误仍然存​​在,我也尝试使用原始的encoding ='utf-8':

UnicodeEncodeError:'ascii'编解码器无法在位置0编码字符'\ u202a':序数不在范围内(128)

我也尝试使用codecs.open,但是结果仍然存在。

也许这里有人知道如何解决这个问题?最好将替换会导致错误的字符替换为?标志。

谢谢!

0 个答案:

没有答案