我有一个来自SAS的文件,该文件作为较旧的Excel .xls文件导出。我想将此文件导入python 3.5。
当我这样做时:
import pandas as pd
Filewant = pd.read_excel("Filepath\\\Filename.xls")
我收到了一堆错误消息,最终在
中XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'<html xm'
如果我打开文件并手动将其保存在当前的.xlsx文件中并使用相同的命令行:
Filewant = pd.read_excel(&#34; Filepath \\ Filename \ .xlsx&#34;)
然后将文件正确导入Python。但是,我希望该过程更加自动化,因此我不必手动将文件保存为.xlsx格式以使其正常工作。
答案 0 :(得分:1)
SAS技术支持告诉我,这不起作用,我需要将.xls SAS输出转换为.xlsx文件:
不幸的是,MSOffice2K目标创建了一个HTML文件,即使它在此处使用.XLS扩展名允许使用excel打开该文件。 您可以使用VBScript将文件转换为.XLSX,但是,使用MSoffice2K目标无法执行此操作。
答案 1 :(得分:0)
错误消息告诉您问题。 found b'<html xm'
您的文件是HTML文件,而不是XLS文件。这通常用“旧”SAS完成,因为它不支持编写XLS文件,但Excel确实支持读取HTML文件。