Question

我正在尝试使用Jupyter笔记本上的熊猫导入.csv数据集文件。我不断收到相同的“ unicode解码错误”消息

我尝试了使用(r'file name')和不使用import pandas as pd df = pd.read_csv(r'C:\users\justanotheregg\Downloads\medals.csv')，并加倍反斜杠，以及使用正斜杠

这是我的代码

UnicodeDecodeError                        Traceback (most recent call last)
pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas/_libs/parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 12: invalid start byte

During handling of the above exception, another exception occurred:

这是我收到的东西的一部分

uwsgi-gevent

Answer 1

您的CSV文件显然不是UTF-8格式，但这是该功能默认情况下期望的格式。您需要找出文件的编码格式（如果是Excel导出，则可能是“ cp-1252”； ISO-8859系列中的其他可能的编码没有0x92的映射，在1252年，用单引号’结束，在MS Office编写的文本中很常见），而将pass its name称为optional encoding parameter。

Answer 2

我有同样的问题。

只需将其保存到Google表格中，然后下载相同的文件，熊猫便可以在jupyter笔记本中读取它。

当我尝试导入python时，.csv文件返回“ unicode错误”

2 个答案: