读取xls文件时的XLRDError

时间:2016-08-24 08:22:07

标签: python encoding xlrd

我尝试通过以下代码阅读excel文件:

import os
import xlrd

files = os.listdir(".")[1:101]


for file in files:
    workbook = xlrd.open_workbook(file)

但是我收到了这样的错误消息。

  

XLRDError:不支持的格式或损坏的文件:预期的BOF记录;发现b' \ r \ n \ r \ n \ r \ n \ r \ n'

所以我尝试逐个打开文件。

我发现这样命名的文件是可读的, "的 14.08.01-08.07.xlsx.xlsx " 但是这种格式的文件不可读。 "的 14.08.22-08.28.xlsx.xls "

所以我打开了文件,发现扩展名为" xlsx.xls "的文件有编码问题。

这些文件包含韩文字符,因此我尝试通过将编码更改为utf-8来打开它们,但是徒劳无功。

总之,我认为由于编码问题,我无法阅读 xlsx.xls 文件。

无论如何都要解决这类问题?

1 个答案:

答案 0 :(得分:1)

尝试xlrd.open_workbook(file, encoding_override="utf-8")