如何根据条件获得累积金额

时间:2016-05-19 14:55:05

标签: r

我有一个包含数百万个值的数据集,其中包含2列(ID,Amount)。金额按降序排序。我需要根据条件获得累计金额总和。

ID       Amount
101      40000
102      20000
103      15000
104      10000
......

例如,如果有1000行,我需要前1%的累积总和,即排序后的前10行,然后4%(40),15%(150),35%(350)和50%以下(500 )。

我如何在R

中得到这个

2 个答案:

答案 0 :(得分:1)

为什么不

data <- 1:1000
n <- length(data)
quantile <- 0.01 # cumsum top 1%
cumsum(data[1:floor(n*quantile)])

答案 1 :(得分:0)

我会开始确保对数据框进行排序......, 我假设你只想要聚合的cumsum,而不是细节

import pyxb
import pyxb.binding
import pyxb.binding.saxer
import StringIO
import pyxb.utils.utility
import pyxb.utils.domutils