什么是最快的全文搜索算法/ API(开源或商业)?

时间:2010-02-21 17:28:46

标签: algorithm search full-text-search

是否有任何银子弹用于搜索中等大小的文本数据(数百GB)?不关心它是商业还是开源。我应该补充一点,我需要它是基于C ++或C的。

3 个答案:

答案 0 :(得分:3)

Apache Lucene是一种常用的索引引擎,不确定它是否符合银弹的条件。我已经看到这与Carrot2相结合,用于聚类和搜索索引。

答案 1 :(得分:1)

还有xapian

答案 2 :(得分:0)

Solr也可以选择。这也是一个基于Lucene的引擎。

http://lucene.apache.org/solr/