我正在尝试为大型集合编写搜索引擎,以用于学习目的。我从自己的直觉开始。然后我研究并最终到达了一个工作模型。
我正在构建一个巨大的哈希表来保存我的集合中的所有术语。从集合中构造它是非常昂贵的。一旦我计算了表,我想将它保存到磁盘,这样每当我想在我的程序中访问这个哈希表时,我就可以从磁盘再次加载它。
有没有任何标准方法可以做到这一点,还是我必须发明自己的文件格式和黑客才能做到这一点?
注意:has-table仅用于存储所有术语,我计划将主要排名数据存储在帖子文件中,并将其指针设置在hash-table的相应术语中。
我在C工作。