在第一个熊猫python上排序时,保持第二级的多索引完整

时间:2019-05-08 08:25:01

标签: python python-3.x pandas pandas-groupby

我已使用以下方法对第一级索引进行了排序:Custom sort order function for groupby pandas python

def my_func(group):
    return sum(group["B"]*group["C"])

idx=df.groupby('A').apply(my_func).reindex(df.index.get_level_values(0))
df.iloc[idx.argsort()]

问题在于,第二级排序在对第一级进行排序后变得混乱。如何确保组内订单得到保留?

来自

A   B C
1 0 1 8
  1 3 3
2 0 1 2
  1 2 2
3 0 1 3
  1 2 4

A   B C
2 0 1 2
  1 2 2
3 0 1 3
  1 2 4
1 0 1 8
  1 3 3

而不是(倒数第二行)

A   B C
2 0 1 2
  1 2 2
3 0 1 3
  1 2 4
1 1 3 3
  0 1 8

1 个答案:

答案 0 :(得分:0)

我认为您需要稳定的排序algo-mergesort

idx=df.index.get_level_values(0).map(df.groupby('A').apply(my_func))
df = df.iloc[idx.argsort(kind='mergesort')]
print (df)
     B  C
A        
2 0  1  2
  1  2  2
3 0  1  3
  1  2  4
1 0  1  8
  1  3  3