计算百分位数

时间:2013-06-23 10:47:55

标签: algorithm haskell containers

我正在编写一个会生成大量数据的程序。我想找到关于这些数据的各种百分位数。

显而易见的方法是将数据存储在某种排序容器中。是否有任何Haskell库提供一个自动排序的容器,并提供对任意索引的快速随机访问?

另一种方法是使用无序容器并在最后执行排序。我不知道这是否会更快。无论哪种方式,我们仍然需要一个提供快速随机访问的容器。 (数组,也许......)

建议?

(另一个选择是建立一个直方图,而不是将整个数据集保存在内存中。但由于目标是非常准确地计算百分位数,我不愿意沿着这条路走下去。我也不知道我的数据范围,直到我生成它...)

1 个答案:

答案 0 :(得分:5)

  

是否有任何Haskell库提供一个自动排序的容器,并提供对任意索引的快速随机访问?

是的,这是你的好Data.Map。请参阅«{1}}以及«索引»类别下的其他功能。

elemAt不提供这些功能,但您可以使用Data.Set进行模拟。