熊猫读取文本文件时,'utf-8'编解码器无法解码位置中的字节0x96 ... read_csv

时间:2019-09-15 21:52:11

标签: python text

我想通过使用熊猫read_csv来读取文本文件,但出现错误 'utf-8' codec can't decode byte 0x96 in position 28: invalid start byte

我尝试了其他帖子中的read_csvencoding='latin1'encoding='iso-8859-1'的{​​{1}}。但是他们都不适合我。对于encoding='cp1252',我收到了encoding='latin1'

的错误

这是我读取文件的方式:

Error tokenizing data. C error: Expected 1 fields in line 6, saw 3

有人可以帮我解决这个问题吗?谢谢

1 个答案:

答案 0 :(得分:0)

原因

tokenizing data. C error: Expected 1 fields in line 6, saw 3

该文件不是正确的CSV格式。您有1-5行没有',',而在第6行有2','。

但是,您可以使用文件读取操作来读取文件。 请按照以下步骤操作:
1.在记事本中打开文件。
2.单击另存为选项
3.在保存按钮的左侧,您可以选择编码。
4.选择utf-8作为编码。
5.尝试此代码

这些步骤将解决

utf-8' codec can't decode byte 0x96 in position 28: invalid start byte

代码:

f = open('004.txt','r')
data = f.read()
print(data)