如何构建即时搜索引擎? (有排名/相关性)

时间:2010-02-04 22:40:50

标签: mysql database search indexing sphinx

我是Sphinx和Lucene的重要用户。 Sphinx只需要一个数据库,对其进行索引。你打电话给Sphinx来获取ID。

但是,如果我想创建一个非常微小的搜索引擎,该怎么办?只需几行数据和几段单词?诀窍是,数据行不断变化。所以,我不能拥有“索引”。

我希望能够按照相关性进行排名,就像Sphinx一样。我怎么能这样做? 当然,我不会通过索引......

2 个答案:

答案 0 :(得分:1)

如果每行只有几行数据和几段单词,请将其全部保存在内存中,并使用对您的内容最有意义的文本算法。

答案 1 :(得分:0)

  

当然,我不会通过索引......

如何在不查看所有内容的情况下确定相关性?

如果只有一小部分数据,而且变化太大以至于维护索引是不切实际的,那么无论何时想要搜索数据,查询数据,然后在下次删除索引时,都可以生成索引。数据发生了变化。使用小数据集,频繁更新和不频繁的查找,这可能比维护索引更有效。