我正在尝试使用Jupyter笔记本上的熊猫导入.csv数据集文件。我不断收到相同的“ unicode解码错误”消息
我尝试了使用(r'file name')
和不使用import pandas as pd
df = pd.read_csv(r'C:\users\justanotheregg\Downloads\medals.csv')
,并加倍反斜杠,以及使用正斜杠
这是我的代码
UnicodeDecodeError Traceback (most recent call last)
pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()
pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()
pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._string_convert()
pandas/_libs/parsers.pyx in pandas._libs.parsers._string_box_utf8()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 12: invalid start byte
During handling of the above exception, another exception occurred:
这是我收到的东西的一部分
uwsgi-gevent
答案 0 :(得分:0)
您的CSV文件显然不是UTF-8格式,但这是该功能默认情况下期望的格式。您需要找出文件的编码格式(如果是Excel导出,则可能是“ cp-1252”; ISO-8859系列中的其他可能的编码没有0x92的映射,在1252年,用单引号’
结束,在MS Office编写的文本中很常见),而将pass its name称为optional encoding parameter。
答案 1 :(得分:0)
我有同样的问题。
只需将其保存到Google表格中,然后下载相同的文件,熊猫便可以在jupyter笔记本中读取它。