我有一个Excel工作簿报告(abc.xlsx),我试图解析以从几列中获取数据,我想知道如何在Python / Pandas中完成。报告采用报告格式,因此格式不像行列配置,如下所示:
My Report ABC LLC from 06/01/2015 to 06/30/2015 Instrument Identifier Quantity Start End Total North America XYZ 100 0 0 (1,893.52) North America Subtotal (1,893.52) Europe ABC 50 10 20 (4,653.21) Europe Subtotal (4,653.21
我感兴趣的数据是标识符(在我的Excel中,它在列B和C中,它们被合并)和Total(列G)。这里的挑战是这种格式有点不规则,并有一个小计行。我能想到的一种方法是通过Pandas使用read_excel读取这个,然后遍历行,只考虑列B& C和G的行,但是不知道如何处理标题和合并单元格的情况。这种方法也非常难看,所以我想知道是否有人在Excel中解析类似报告的经验。