如何在多索引pandas数据帧中根据索引级别获取子总数

时间:2017-08-24 08:34:41

标签: python pandas dataframe multi-index

我在pandas中有一个数据框如下:

columns               Year_1  Year_2
Idx_lvl_0  Idx_lvl_1
Cons.      Prod_1        156    1541
           Prod_2        312    2311
Del.       Prod_1         23      12
           Prod_2          0       4

问题:我如何根据Idx_lvl_0得到小计(Cons_total和Del_total)如下。

columns               Year_1  Year_2
Idx_lvl_0  Idx_lvl_1
Cons.      Prod_1        156    1541
           Prod_2        312    2311
           Cons_total    468    3852
Del.       Prod_1         23      12
           Prod_2          0       4
           Del_total      23      16

1 个答案:

答案 0 :(得分:3)

这是一种方式。在sum

中的level=0处获取dfs总计
In [1382]: dfs = df.sum(level=0)

如果顺序不重要,只需追加附加索引的结果。

In [1383]: df.append(dfs.assign(Idx_lvl_1=dfs.index.str[:-1] + '_Total')
                        .set_index('Idx_lvl_1', append=True))
Out[1383]:
                      Year_1  Year_2
Idx_lvl_0 Idx_lvl_1
Cons.     Prod_1         156    1541
          Prod_2         312    2311
Del.      Prod_1          23      12
          Prod_2           0       4
Cons.     Cons_Total     468    3852
Del.      Del_Total       23      16

对于订单,您可以使用sort_index

In [1384]: df.append(dfs.assign(Idx_lvl_1=dfs.index.str[:-1] + '_Total')
                        .set_index('Idx_lvl_1', append=True)).sort_index()
Out[1384]:
                      Year_1  Year_2
Idx_lvl_0 Idx_lvl_1
Cons.     Cons_Total     468    3852
          Prod_1         156    1541
          Prod_2         312    2311
Del.      Del_Total       23      16
          Prod_1          23      12
          Prod_2           0       4

dfs

In [1385]: dfs
Out[1385]:
           Year_1  Year_2
Idx_lvl_0
Cons.         468    3852
Del.           23      16