标签: search-engine text-mining
我正在寻找一个搜索引擎,可以根据搜索查询从我的本地数据库中查找文档。该过程不涉及任何网页。它们仅包含一组文本文档(pdf和doc文件)。 请为此过程建议一些有效的搜索引擎。
答案 0 :(得分:1)
我首先尝试Solr(它建立在Lucene之上)。附带一个漂亮的基于Web的管理工具。
答案 1 :(得分:1)
工具
Solr:强大的文本搜索和动态群集。试试其中的示例文档。
Mahout:热门群集算法已经存在于其中
Lucene:功能齐全的文字搜索引擎库
在我看来, Solr 将是搜索目的的最佳选择。
答案 2 :(得分:0)
我建议使用Lucene /Lucene.Net,但可以找到here和here的替代品。