Question

x = df.groupby(["Customer ID", "Category"]).sum().sort_values(by="VALUE", ascending=False)

我想按客户ID进行分组，但是当我使用上面的代码时，它会复制客户......

结果如下：

来源DF：

  Customer ID Category  Value
0           A        x      5
1           B        y      5
2           B        z      6
3           C        x      7
4           A        z      2
5           B        x      5
6           A        x      1

新：https://ufile.io/dpruz

Answer 1

我认为你正在寻找这样的东西：

df_out = df.groupby(['Customer ID','Category']).sum()
df_out.reindex(df_out.sum(level=0).sort_values('Value', ascending=False).index,level=0)

输出：

                      Value
Customer ID Category       
B           x             5
            y             5
            z             6
A           x             6
            z             2
C           x             7

Pandas在分组时重复

1 个答案: