我正在尝试使用熊猫读取当前文件夹的sunfolder中的csv文件。我在Windows PC上。
如果我跑步:
df=pd.read_csv("subfolder//file.csv")
我得到:
UnicodeDecodeError:'utf-8'编解码器无法解码位置的字节0xb2 16:无效的起始字节
如果我跑步:
df=pd.read_csv("subfolder//file.csv", engine='python')
有效。
为什么????
没有办法使用c作为引擎吗?它意味着更快
答案 0 :(得分:1)
这可能是因为read_csv试图读取“ UTF-8”格式的文件,而您的文件显然是另一种格式。要检测Windows中的编码,可以查看一下。 Get encoding of a file in Windows
找到文件的编码格式后,可以为read_csv函数提供编码类型的参数。例如
df=pd.read_csv("subfolder//file.csv", encoding="utf-8")