我尝试使用pandas.read_excel读取.xls文件。它在我的大多数.xls文件中都成功了,但是对于某些文件,它会出错,并显示以下错误消息:
Unsupported format, or corrupt file: Expected BOF record; found '\x00\x05\x16\x07\x00\x02\x00\x00'
我一直在努力研究为什么会发生这种情况,但不是所有文件。 xlrd版本是1.0.0。我尝试用xlrd.open_workbook手动读入,我得到了相同的结果。
有没有人知道这个BOF记录是指什么文件类型?
答案 0 :(得分:1)
出现错误消息的原因有多种。但是,主要原因可能是Excel文件本身。有时,特别是如果您从某个报告门户中提取Excel文件,Excel文件可能已损坏,因此最好的方法是打开Excel文件并将其另存为新的.xls文件,然后重试运行pandas.read_excel
Lemme知道它是否有效。
答案 1 :(得分:0)
我解决了使用pd.read_table加载它的问题(它将所有内容加载到一列中)
df = pd.read_table('path/to/xls_file/' + 'my_file.xls')
然后我将其与
分开df = df['column_name'].str.split("your_separator", expand=True)
答案 2 :(得分:-2)
请检查您是否提供了正确的文件扩展名(xlsx 或 csv)。指定的文件扩展名错误可能会导致此问题。