关于Bloom Filter实现的一些问题

时间:2009-10-20 15:02:05

标签: data-structures language-agnostic bloom-filter

我最近发现了一个设置某些代码kata的网站。

其中一个卡塔引起了我的注意,让我看着布鲁姆过滤器。

我正在使用PHP和MySql。

我有一个大约45,000个单词的表作为字典,我编写了代码来创建一个bloom过滤器数组。

我的问题是......

  1. 代码应该在什么时候运行以创建Bloom过滤器数组 a)当用户访问页面时 b)每次搜索运行 c)由我一次,然后存储以备将来使用 d)完全不同的东西

  2. 我应该如何存储数组 a)将其保存在一个数组中 b)写入文本文件 c)创建一个新表并将其存储在那里 d)完全不同的东西

  3. 任何有布隆过滤器经验的人都可以提供帮助。

    干杯 迟发型

1 个答案:

答案 0 :(得分:2)

1)c(也许,在会话中)。

2)a(在记忆中)。

对于只有45,000个单词,您可以将整个列表保留在内存中哈希中,并且仍然具有快速查找。可能不需要布隆过滤器。

- jorge。