Question

我正在寻求帮助，以收集“熊猫数据”框架中前95％的销售额，在该框架中我需要按类别列进行分组。我发现以下内容（代码的顶部）已关闭。我的df中的TotalDollars已按降序进行了正确排序，但结果行数超过总金额的前95％。

Total Dollars     Percent     Running Percent

117388     11.09%    11.09%

81632     7.71%     18.80%

46316     4.38%     23.18%

41500     3.92%     27.10%

在达到95％的运行总计百分比后，想要消除该类别的剩余行。我不需要“百分比”或“运行百分比”作为df字段（仅供参考）。

df1 = (df.groupby('channel',group_keys=False)
        .apply(lambda x: x.nlargest(int(len(x) * a), 'score')))

我的代码：

df_out = (df_Sales.groupby('category', group_keys=False).apply(lambda x: x.nlargest(int(len(x) * 0.95), 'TotalDollars')))

Answer 1

'Frontend'

如果您打算将其用于多列，则要复杂得多，但是方法非常相似。

在数据框中查找列值的前95％的代码

1 个答案: