在Python中读取格式化的excel文件

时间:2018-01-20 10:01:48

标签: python python-3.x pandas

我在使用pandas读取xlsx文件时遇到问题。该文件格式为slighlty。以下是文件 - sample.xlsx

我在Python3中使用以下代码:

>>> import pandas as pd
>>> file = pd.ExcelFile('sample.xlsx')
>>> file.sheet_names
>>> temp = file.parse('Named Insured')
>>> temp.shape

形状显示740,10,而原始文件则完全不同。提取的数据也是混乱的。

1 个答案:

答案 0 :(得分:0)

该文件采用2007-2013 Excel XML格式(根据 LibreOffice

pandas.read_excel()无效,请参阅Read Excel XML .xls file with pandas以了解问题和可能的解决方案......

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html