我尝试通过以下代码阅读excel文件:
import os
import xlrd
files = os.listdir(".")[1:101]
for file in files:
workbook = xlrd.open_workbook(file)
但是我收到了这样的错误消息。
XLRDError:不支持的格式或损坏的文件:预期的BOF记录;发现b' \ r \ n \ r \ n \ r \ n \ r \ n'
所以我尝试逐个打开文件。
我发现这样命名的文件是可读的, "的 14.08.01-08.07.xlsx.xlsx " 但是这种格式的文件不可读。 "的 14.08.22-08.28.xlsx.xls "
所以我打开了文件,发现扩展名为" xlsx.xls "的文件有编码问题。
这些文件包含韩文字符,因此我尝试通过将编码更改为utf-8来打开它们,但是徒劳无功。
总之,我认为由于编码问题,我无法阅读 xlsx.xls 文件。
无论如何都要解决这类问题?
答案 0 :(得分:1)
尝试xlrd.open_workbook(file, encoding_override="utf-8")