Pandas.read_excel:不支持的格式或损坏的文件:预期的BOF记录

时间:2017-08-15 20:03:00

标签: python excel pandas xlrd

我尝试使用pandas.read_excel读取.xls文件。它在我的大多数.xls文件中都成功了,但是对于某些文件,它会出错,并显示以下错误消息:

Unsupported format, or corrupt file: Expected BOF record; found '\x00\x05\x16\x07\x00\x02\x00\x00'

我一直在努力研究为什么会发生这种情况,但不是所有文件。 xlrd版本是1.0.0。我尝试用xlrd.open_workbook手动读入,我得到了相同的结果。

有没有人知道这个BOF记录是指什么文件类型?

3 个答案:

答案 0 :(得分:1)

出现错误消息的原因有多种。但是,主要原因可能是Excel文件本身。有时,特别是如果您从某个报告门户中提取Excel文件,Excel文件可能已损坏,因此最好的方法是打开Excel文件并将其另存为新的.xls文件,然后重试运行pandas.read_excel

Lemme知道它是否有效。

答案 1 :(得分:0)

我解决了使用pd.read_table加载它的问题(它将所有内容加载到一列中)

df = pd.read_table('path/to/xls_file/' + 'my_file.xls')

然后我将其与

分开
df = df['column_name'].str.split("your_separator", expand=True)

答案 2 :(得分:-2)

请检查您是否提供了正确的文件扩展名(xlsx 或 csv)。指定的文件扩展名错误可能会导致此问题。