Pandas multiindex dataframe - 从multiindex中的一个索引中选择max

时间:2017-04-02 00:07:17

标签: python python-3.x pandas dataframe data-science

我有一个数据框,其中包含年度和月份的多索引,如下所示

<path>

我正在尝试选择每年的最大值,并将其放入这样的DF中:

     |     |Value
Year |Month|  
     |  1  |  3
1992 |  2  |  5
     |  3  |  8
     | ... | ...
1993 |  1  |  2
     | ... | ...

关于多索引的信息不多,我应该简单地分组并应用或类似的东西来使它变得更简单吗?

2 个答案:

答案 0 :(得分:5)

完全正确:

df.groupby(level=0).apply(max)

在我的示例中DataFrame

                     0
Caps Lower            
A    a     0  0.246490
           1 -1.265711
           2 -0.477415
           3 -0.355812
           4 -0.724521
     b     0 -0.409198
           1 -0.062552
           2 -0.731789
           3  1.131616
           4  0.085248
B    a     0  0.193948
           1  2.010710
           2  0.289300
           3  0.305373
           4  1.376965
     b     0  0.210522
           1  1.431279
           2 -0.247171
           3  0.899074
           4  0.639926

结果:

             0
Caps          
A     1.131616
B     2.010710

顺便说一下,这就是我创建DataFrame的方式:

df = pd.DataFrame(np.random.randn(5,4), columns = l)
df.columns = pd.MultiIndex.from_tuples(df.columns, names=['Caps','Lower'])
df = pd.DataFrame(df.unstack())

答案 1 :(得分:1)

更简单的解决方案仅为max

#bernie's sample data
df = df.max(level=0)
print (df)
             0
Caps          
A     1.131616
B     2.010710