如何将非结构化的Excel电子表格加载到pandas中?

时间:2017-06-10 01:00:22

标签: python excel pandas

我熟悉如何将excel电子表格加载到pandas数据框中。但是,假设电子表格本身具有明确定义的列和行。我有1个excel表,其中包含多个表,每个表具有不同的行数和列数。在同一张表中还有一些文本和表格。有关如何将其加载到熊猫的任何建议?感谢。

2 个答案:

答案 0 :(得分:0)

pandas支持多种数据格式。

  1. 使用pd.read_excel,它可以读取Excel电子表格文件(.xlsx)

  2. 将电子表格导出到csv并使用pd.read_csv。我喜欢使用这种方法。

  3. 使用pd.ExcelFile加载,它的外观类似于方法1.但速度更快另见other answer

答案 1 :(得分:0)

df = pd.read_excel('path/to/excel', engine='openpyxl')
records = df.to_dict('records')

然后创建一个解析器来逐行读取records。将 keys 与字段名称匹配并提取相应/相邻信息。