我正在尝试使用pandas导入数据集并收到以下错误消息:
UnicodeDecodeError:' utf-8'编解码器不能解码位置10中的字节0xa0:无效的起始字节
我读过有关编码的内容并尝试将其用作
df=pd.read_csv("file.csv",encoding="ISO-xxxx")
它显示错误为无效语法。
如果你们想看一下,我正在分享我的数据链接:https://www.kaggle.com/venkatramakrishnan/india-water-quality-data
答案 0 :(得分:0)
import pandas as pd
df = pd.read_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')
以上代码是用 python 3.6 和 pandas'0.20.1'编写的解决方案之一。
为什么会出现此问题?
默认情况下, utf-8 有一些特殊字符无法使用 解码。如果您有原始数据,请尝试使用pandas使用 csv 以下代码:
df.to_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')