如何从多索引枢轴计算值

时间:2019-12-21 13:31:25

标签: python pandas dataframe pivot

我的多索引df看起来像这样:

                                              Value
date          A      B        City   
10-12-2019   14      10       California       15   
12:00                         Los Angeles      60
                              Chicago          80

10-12-2019   13      NaN      California       15   
12:20                         Los Angeles      60
                              Chicago          80

10-12-2019   14      NaN      California       10   
12:40                         Los Angeles      20
                              Chicago          60

10-12-2019   16      20       California       65   
13:00                         Los Angeles      20
                              Chicago          80

10-12-2019   16      NaN      California       65   
13:20                         Los Angeles      20
                              Chicago          80
...

我想要的输出是

                 city           California       Los Angeles      Chicago

date          A      B         
10-12-2019   14      10             15                60             80
12:00                        


10-12-2019   13      NaN            15                60             80
12:20                         

10-12-2019   14      NaN            10                20             60
12:40     
...

当我使用df = df.groupby(["date", "A", "B", "city"])["value"].mean().unstack("city")时,由于B每小时,我会在20和40分钟内丢失信息。 最后,我想得到:

                 city                 California         Los Angeles       Chicago

date          A          B         
10-12-2019   14.66      100             2500                3460            4080


11-12-2019   13.298     250             3500                3260            2880


其中,“日期”是所有小时和日期的减少时间,是一天,“ A”是所有列的平均值, 'B'是每小时所有值的总和,'city'是所有值的总和

请帮助我

0 个答案:

没有答案