在数据框中查找列值的前95%的代码

时间:2019-05-03 03:12:59

标签: python-3.x pandas

我正在寻求帮助,以收集“熊猫数据”框架中前95%的销售额,在该框架中我需要按类别列进行分组。我发现以下内容(代码的顶部)已关闭。我的df中的TotalDollars已按降序进行了正确排序,但结果行数超过总金额的前95%。

Total Dollars     Percent     Running Percent

117388     11.09%    11.09%

81632     7.71%     18.80%

46316     4.38%     23.18%

41500     3.92%     27.10%

在达到95%的运行总计百分比后,想要消除该类别的剩余行。我不需要“百分比”或“运行百分比”作为df字段(仅供参考)。

df1 = (df.groupby('channel',group_keys=False)
        .apply(lambda x: x.nlargest(int(len(x) * a), 'score')))

我的代码:

df_out = (df_Sales.groupby('category', group_keys=False).apply(lambda x: x.nlargest(int(len(x) * 0.95), 'TotalDollars')))

1 个答案:

答案 0 :(得分:1)

'Frontend'

如果您打算将其用于多列,则要复杂得多,但是方法非常相似。