我想通过使用熊猫read_csv
来读取文本文件,但出现错误
'utf-8' codec can't decode byte 0x96 in position 28: invalid start byte
我尝试了其他帖子中的read_csv
,encoding='latin1'
或encoding='iso-8859-1'
的{{1}}。但是他们都不适合我。对于encoding='cp1252'
,我收到了encoding='latin1'
这是我读取文件的方式:
Error tokenizing data. C error: Expected 1 fields in line 6, saw 3
有人可以帮我解决这个问题吗?谢谢
答案 0 :(得分:0)
原因
tokenizing data. C error: Expected 1 fields in line 6, saw 3
该文件不是正确的CSV格式。您有1-5行没有',',而在第6行有2','。
但是,您可以使用文件读取操作来读取文件。
请按照以下步骤操作:
1.在记事本中打开文件。
2.单击另存为选项
3.在保存按钮的左侧,您可以选择编码。
4.选择utf-8作为编码。
5.尝试此代码
这些步骤将解决
utf-8' codec can't decode byte 0x96 in position 28: invalid start byte
代码:
f = open('004.txt','r')
data = f.read()
print(data)