'utf-8'编解码器无法解码位置24的字节0xa0:无效的起始字节

时间:2019-08-10 15:04:52

标签: python pandas

我正在尝试使用以下csv代码行来读取Python文件:

crimes = pd.read_csv('C:/Users/usuario1/Desktop/python/csv/001 Boston crimes/crime.csv', encoding = 'utf8')
crimes.head(5)

但是我收到以下错误消息:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 24: invalid start byte

出了什么问题?

1 个答案:

答案 0 :(得分:0)

您的文件可能不支持utf-8编解码器,或者其字符不支持utf-8。您可以尝试使用其他编码,例如ISO-8859-1。但是最好先检查文件编码。为此,应执行以下操作: 1。

    with open('Your/file/path') as f:
        print(f)

这应该打印带有编码的文件详细信息。

  1. 或者您可以只打开csv,然后转到“文件”->“保存为”,这将显示您的编码。

  2. 如果这些都不起作用,则可以使用`error_bad_lines = False'忽略引起问题的行

    crimes = pd.read_csv('Your/file/path', encoding='utf8', error_bad_lines=False)
    

    希望这些会有所帮助