搜索引擎从本地数据库中搜索文档

时间:2012-01-02 03:55:51

标签: search-engine text-mining

我正在寻找一个搜索引擎,可以根据搜索查询从我的本地数据库中查找文档。该过程不涉及任何网页。它们仅包含一组文本文档(pdf和doc文件)。    请为此过程建议一些有效的搜索引擎。

3 个答案:

答案 0 :(得分:1)

我首先尝试Solr(它建立在Lucene之上)。附带一个漂亮的基于Web的管理工具。

答案 1 :(得分:1)

工具

  1. Solr:强大的文本搜索和动态群集。试试其中的示例文档。

  2. Mahout:热门群集算法已经存在于其中

  3. Lucene:功能齐全的文字搜索引擎库

  4. 在我看来, Solr 将是搜索目的的最佳选择。

答案 2 :(得分:0)

我建议使用Lucene /Lucene.Net,但可以找到herehere的替代品。