Python3.x,pandas,csv,utf-8错误

时间:2017-06-12 22:51:12

标签: python-3.x csv pandas encoding utf-8

我正在尝试使用pandas导入数据集并收到以下错误消息:

  

UnicodeDecodeError:' utf-8'编解码器不能解码位置10中的字节0xa0:无效的起始字节

我读过有关编码的内容并尝试将其用作

df=pd.read_csv("file.csv",encoding="ISO-xxxx")

它显示错误为无效语法。

如果你们想看一下,我正在分享我的数据链接:https://www.kaggle.com/venkatramakrishnan/india-water-quality-data

1 个答案:

答案 0 :(得分:0)

import pandas as pd 

df = pd.read_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')

以上代码是用 python 3.6 pandas'0.20.1'编写的解决方案之一。

为什么会出现此问题?

  

默认情况下, utf-8 有一些特殊字符无法使用   解码。如果您有原始数据,请尝试使用pandas使用 csv   以下代码:

df.to_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')