标签: algorithm bloom-filter
n = # of items m = # of bits in BF array
Wikipedia表示哈希函数的最佳数量是k = (m/n) ln 2。
k = (m/n) ln 2
如果n远大于m,该怎么办?例如,如果我们有大量的项目,但只有有限的内存用于bloom过滤器。如果m为100万,那么使用k公式,n为1000万或100亿将导致k默认为1哈希函数。我认为k会随着n一起增加,以便更好地分发项目并最大限度地减少误报的数量。
n
m
k