所以Count-Min Sketch的重点是更新某些计数器,具体取决于提供的哈希函数的结果。但是,这些计数器的内存有限,运行一段时间后,它们可能会溢出,从MAX值下降到MIN值(就像整数一样)。假设我需要的只是草图中N个最常用的值,除了每隔一段时间重新启动草图之外,有没有办法避免这种情况?
答案 0 :(得分:1)
如果您担心,请使用适当大小的整数。
8字节(长整数)无符号整数的最大值为18,446,744,073,709,551,615。这应该足够了。
修改强>
假设我需要的是草图中N个最常用的值,除了每隔一段时间重新启动草图之外,有没有办法避免这种情况?
也许您可以根据自己的需要调整reservoir sampling。