我熟悉如何将excel电子表格加载到pandas数据框中。但是,假设电子表格本身具有明确定义的列和行。我有1个excel表,其中包含多个表,每个表具有不同的行数和列数。在同一张表中还有一些文本和表格。有关如何将其加载到熊猫的任何建议?感谢。
答案 0 :(得分:0)
pandas支持多种数据格式。
使用pd.read_excel
,它可以读取Excel电子表格文件(.xlsx)
将电子表格导出到csv并使用pd.read_csv
。我喜欢使用这种方法。
使用pd.ExcelFile
加载,它的外观类似于方法1.但速度更快另见other answer
答案 1 :(得分:0)
df = pd.read_excel('path/to/excel', engine='openpyxl')
records = df.to_dict('records')
然后创建一个解析器来逐行读取records
。将 keys
与字段名称匹配并提取相应/相邻信息。