我有一个包含数百万个值的数据集,其中包含2列(ID,Amount)。金额按降序排序。我需要根据条件获得累计金额总和。
ID Amount
101 40000
102 20000
103 15000
104 10000
......
例如,如果有1000行,我需要前1%的累积总和,即排序后的前10行,然后4%(40),15%(150),35%(350)和50%以下(500 )。
我如何在R
中得到这个答案 0 :(得分:1)
为什么不
data <- 1:1000
n <- length(data)
quantile <- 0.01 # cumsum top 1%
cumsum(data[1:floor(n*quantile)])
答案 1 :(得分:0)
我会开始确保对数据框进行排序......, 我假设你只想要聚合的cumsum,而不是细节
import pyxb
import pyxb.binding
import pyxb.binding.saxer
import StringIO
import pyxb.utils.utility
import pyxb.utils.domutils