搜索引擎之间的主要区别是什么应该影响决定哪些用于搜索专有数据?

时间:2008-11-10 17:19:06

标签: search lucene.net requirements dtsearch

搜索引擎(DtSearch,Lucene.net,Sphinx,Google等)之间的主要区别是什么应该影响决定使用哪种搜索专有数据?

要搜索的数据包括使用名称/值对形式的元数据标记的无表示数据。我们对各种工具的格式解析能力不感兴趣。此外,搜索结果需要结构良好,无需呈现的数据,可以与其他(类似结构化的存储库)的搜索结果进行聚合。

下面列出了需要通知决策的一些相关搜索引擎特征。 Futther建议或经验描述欢迎。

•成本 • 便于使用 •可以配置为仅返回特定标签 •可以“识别”特定术语,使搜索结果对这些结果具有更高的权重 •快速<返回搜索结果或%E6记录/文档的时间为0.3秒 •支持带有类型的标签(找天气='阳光'但不是个性=阳光) •支持权重以提供相关性排名 •按保险额的顺序返回排名顺序 •支持同义词 •支持干预 •支持停用词 •支持拼写更正 •适合并行化或索引构建(如果基于索引) •快速重新索引(如果基于索引) •快速更新索引(如果基于索引) •合并多个索引的结果(如果基于索引) •邻近检查:与在一起发现的单词具有更高的相关性

2 个答案:

答案 0 :(得分:2)

我喜欢Solr和DataImportHandler。它支持您的大部分要点,并且只要您不介意编辑某些XML配置文件,就不会太难设置。它比许多企业级搜索引擎更容易。

GSA(Google Search Appliance)没有任何问题,但是对于您想要的控制量,Solr是更好的选择。

Lucene/Solr

答案 1 :(得分:1)

就相关性而言,Google Search Appliance可以进行一些调整。他们认为允许过多的调整会降低相关性,我相信Google知道相关性。

用户不太可能发现Google以外的搜索引擎更易于使用。