我正在构建一个脚本,以便从我们组织的信息中心自动下载Excel文件并将其作为Pandas数据框打开。我已经获得了下载该文件的代码,但我发现,虽然它以.xls扩展名保存,但它实际上是一个HTML文件。
以下是我所拥有的:
import pandas as pd
df = pd.read_excel("report.xls")
我收到此错误:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'Title\tCo'
我尝试过使用read_html,但是返回"找不到表格"。这是有道理的,因为没有要呈现的HTML。是什么给了什么?
答案 0 :(得分:0)
这是一个制表符分隔文件。以下作品:
pd.read_table("report.xls")
然后,您可以将表保存为.xlsx文档,一切都很好。