如何从磁盘中保存并加载一个巨型哈希表?

时间:2013-03-14 05:28:00

标签: c search data-structures hash indexing

我正在尝试为大型集合编写搜索引擎,以用于学习目的。我从自己的直觉开始。然后我研究并最终到达了一个工作模型。

我正在构建一个巨大的哈希表来保存我的集合中的所有术语。从集合中构造它是非常昂贵的。一旦我计算了表,我想将它保存到磁盘,这样每当我想在我的程序中访问这个哈希表时,我就可以从磁盘再次加载它。

有没有任何标准方法可以做到这一点,还是我必须发明自己的文件格式和黑客才能做到这一点?

注意:has-table仅用于存储所有术语,我计划将主要排名数据存储在帖子文件中,并将其指针设置在hash-table的相应术语中。

我在C工作。

1 个答案:

答案 0 :(得分:1)

BDB是一个用于有效管理平面文件数据库的库。特别是支持哈希表格式。如果需要有序访问,也可以使用B树。