我有一个带有多级MultiIndex的DataFrame。
我知道MultiIndex 中有重复项(因为我不关心底层数据库确实关心的区别)
我想总结一下这些副本:
>>> x = pd.DataFrame({'month':['Sep', 'Sep', 'Oct', 'Oct'], 'day':['Mon', 'Mon', 'Mon', 'Tue'], 'sales':[1,2,3,4]})
>>> x
day month sales
0 Mon Sep 1
1 Mon Sep 2
2 Mon Oct 3
3 Tue Oct 4
>>> x = x.set_index(['day', 'month'])
sales
day month
Mon Sep 1
Sep 2
Oct 3
Tue Oct 4
给我
day month
Mon Sep 3
Oct 3
Tue Oct 4
在this SO answer深埋到一个类似的问题是建议:
df.groupby(level=df.index.names).sum()
但在我看来,这不是'readability counts' criterion优秀的Python代码。
有没有人知道一种更人性化的方式?