Question

我想通过使用熊猫read_csv来读取文本文件，但出现错误 'utf-8' codec can't decode byte 0x96 in position 28: invalid start byte

我尝试了其他帖子中的read_csv，encoding='latin1'或encoding='iso-8859-1'的{{1}}。但是他们都不适合我。对于encoding='cp1252'，我收到了encoding='latin1'

的错误

这是我读取文件的方式：

Error tokenizing data. C error: Expected 1 fields in line 6, saw 3

有人可以帮我解决这个问题吗？谢谢

Answer 1

原因

tokenizing data. C error: Expected 1 fields in line 6, saw 3

该文件不是正确的CSV格式。您有1-5行没有'，'，而在第6行有2'，'。

但是，您可以使用文件读取操作来读取文件。请按照以下步骤操作：
1.在记事本中打开文件。
2.单击另存为选项
3.在保存按钮的左侧，您可以选择编码。
4.选择utf-8作为编码。
5.尝试此代码

这些步骤将解决

utf-8' codec can't decode byte 0x96 in position 28: invalid start byte

代码：

f = open('004.txt','r')
data = f.read()
print(data)