我有一个多索引数据框(以Order和Order 2作为索引),如下所示:
Order Order2 Units Cost Units2
1 1 100 2.1 120
2 200 2.2 320
3 100 2.4 520
2 1 100 3.1 120
2 333 2.2 520
3 333 2.3 620
4 100 2.4 220
... ...
我想应用均值函数(https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.mean.html) df.mean表示每个“订单”值的“单位”列
因此数据应显示为:
Order Order2 Units Cost Units2 Units_Mean
1 1 100 2.1 120 133.33
2 200 2.2 320
3 100 2.4 520
2 1 100 3.1 120 216.5
2 333 2.2 520
3 333 2.3 620
4 100 2.4 220
... ...
您能建议一下(从计算的角度来看)最有效的方法是什么,因为我拥有十亿的df。