我正在寻求帮助,以收集“熊猫数据”框架中前95%的销售额,在该框架中我需要按类别列进行分组。我发现以下内容(代码的顶部)已关闭。我的df中的TotalDollars
已按降序进行了正确排序,但结果行数超过总金额的前95%。
Total Dollars Percent Running Percent
117388 11.09% 11.09%
81632 7.71% 18.80%
46316 4.38% 23.18%
41500 3.92% 27.10%
在达到95%的运行总计百分比后,想要消除该类别的剩余行。我不需要“百分比”或“运行百分比”作为df字段(仅供参考)。
df1 = (df.groupby('channel',group_keys=False)
.apply(lambda x: x.nlargest(int(len(x) * a), 'score')))
我的代码:
df_out = (df_Sales.groupby('category', group_keys=False).apply(lambda x: x.nlargest(int(len(x) * 0.95), 'TotalDollars')))
答案 0 :(得分:1)
'Frontend'
如果您打算将其用于多列,则要复杂得多,但是方法非常相似。