当我尝试导入python时,.csv文件返回“ unicode错误”

时间:2019-05-08 05:45:31

标签: pandas csv python-import

我正在尝试使用Jupyter笔记本上的熊猫导入.csv数据集文件。我不断收到相同的“ unicode解码错误”消息

我尝试了使用(r'file name')和不使用import pandas as pd df = pd.read_csv(r'C:\users\justanotheregg\Downloads\medals.csv') ,并加倍反斜杠,以及使用正斜杠

这是我的代码

UnicodeDecodeError                        Traceback (most recent call last)
pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas/_libs/parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 12: invalid start byte

During handling of the above exception, another exception occurred:

这是我收到的东西的一部分

uwsgi-gevent

2 个答案:

答案 0 :(得分:0)

您的CSV文件显然不是UTF-8格式,但这是该功能默认情况下期望的格式。您需要找出文件的编码格式(如果是Excel导出,则可能是“ cp-1252”; ISO-8859系列中的其他可能的编码没有0x92的映射,在1252年,用单引号结束,在MS Office编写的文本中很常见),而将pass its name称为optional encoding parameter

答案 1 :(得分:0)

我有同样的问题。

只需将其保存到Google表格中,然后下载相同的文件,熊猫便可以在jupyter笔记本中读取它。