使用计数草图估算直方图

时间:2017-05-02 19:51:42

标签: algorithm histogram probability-theory

Count Sketch是一种算法,它使用最少的资源来估算多集中元素的出现次数。我有兴趣使用它来构建直方图,尽管它是一个直方图,其中桶是元素出现的频率。但是,我能找到的所有信息仅显示如何使用计数草图查找结尾处元素的出现次数。例如,我们说我有以下数据:

[1,2,2,2,3,5,5,5,5,5,8,10,11,19,19,20,20,20,20]

我想要的是得到一个直方图,告诉我这样的事情(我最接近2次出现的次数):

  • 1次出现的元素数量:5
  • 发生2次的元素数量:1
  • 发生4次的元素数量:2
  • 8次出现的元素数量:1

我不需要能够询问"元素n多久发生一次?",尽管这似乎是人们使用Count Sketch做的主要事情。是否有Count Sketch的变体可以给我一个像我正在寻找的直方图?

0 个答案:

没有答案