pd.read_csv:utf-8'编解码器无法解码位置61的字节0x98:无效的起始字节

时间:2019-09-12 03:51:48

标签: python csv input unicode utf-8

我想从https://www.osha.gov/fatalities/reports/archive下载CSV文件。

enter image description here

请尝试2015财年。

我的代码如下:

a=pd.read_csv('C://.../fy15_federal-state_summaries.csv',encoding = "utf-8")

但是我仍然遇到错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x98 in position 61: invalid start byte

我也尝试了不同的方法。但是,一切都不起作用。有人可以帮我吗?

1 个答案:

答案 0 :(得分:2)

这是encoding问题。

您需要找出文件的正确编码。

在这种情况下,它是1250,所以:

a=pd.read_csv(r'C:\...\fy15_federal-state_summaries.csv',encoding = "1250")