Pandas在分组时重复

时间:2017-11-30 22:06:44

标签: pandas pandas-groupby

x = df.groupby(["Customer ID", "Category"]).sum().sort_values(by="VALUE", ascending=False)

我想按客户ID进行分组,但是当我使用上面的代码时,它会复制客户......

结果如下:

Image

来源DF:

  Customer ID Category  Value
0           A        x      5
1           B        y      5
2           B        z      6
3           C        x      7
4           A        z      2
5           B        x      5
6           A        x      1

新:https://ufile.io/dpruz

1 个答案:

答案 0 :(得分:2)

我认为你正在寻找这样的东西:

df_out = df.groupby(['Customer ID','Category']).sum()
df_out.reindex(df_out.sum(level=0).sort_values('Value', ascending=False).index,level=0)

输出:

                      Value
Customer ID Category       
B           x             5
            y             5
            z             6
A           x             6
            z             2
C           x             7