解析Excel报告

时间:2015-08-24 20:50:23

标签: python pandas report import-from-excel

我有一个Excel工作簿报告(abc.xlsx),我试图解析以从几列中获取数据,我想知道如何在Python / Pandas中完成。报告采用报告格式,因此格式不像行列配置,如下所示:

                                 My Report
                                 ABC LLC
                        from 06/01/2015 to 06/30/2015 

Instrument                Identifier    Quantity    Start    End     Total 

North America
                            XYZ           100         0      0        (1,893.52)
North America Subtotal                                                (1,893.52)

Europe
                            ABC            50         10     20        (4,653.21)
Europe Subtotal                                                       (4,653.21     

我感兴趣的数据是标识符(在我的Excel中,它在列B和C中,它们被合并)和Total(列G)。这里的挑战是这种格式有点不规则,并有一个小计行。我能想到的一种方法是通过Pandas使用read_excel读取这个,然后遍历行,只考虑列B& C和G的行,但是不知道如何处理标题和合并单元格的情况。这种方法也非常难看,所以我想知道是否有人在Excel中解析类似报告的经验。

0 个答案:

没有答案