我被要求部署或开发可以索引几个内部服务器的所有网页的企业(内联网)搜索引擎,并且有一个搜索门户网站来显示所有相关内容,比如谷歌正在做的但是对于内联网
有关快速开发或部署的任何建议吗?我听说过Microsoft FAST产品,不确定它是否用于此目的?
提前谢谢, 乔治答案 0 :(得分:3)
根据您需要的抛光程度,Nutch项目对您来说几乎是一个关键的解决方案。 http://lucene.apache.org/nutch/
答案 1 :(得分:2)
google search appliance是您可能有兴趣查看的硬件解决方案。
基于软件的方法可以是Lucene搜索引擎。
答案 2 :(得分:2)
免费的Microsoft解决方案是Microsoft Search Server Express。与SharePoint中的搜索类似。
答案 3 :(得分:0)
乔治,
听起来你很匆忙。
您最好开始对重新工作,重新工作和重新工作设定期望。
我强烈建议您现在花时间
建立要求,可能是基本,中间和蓝天
确定哪些搜索引擎,前端,抓取工具等(开源或供应商提供),真正满足您的要求
确定对这些工具的可用支持,以及获得及时和可行的答案或解决方案的可能性(开源至少不是这个支持合同)
不要试图一次性完成所有操作。首先进行最小的数据集,无论您的赞助商的管理程度有多远。您不会花费数月时间进行测试,只是为了发现系统中的致命大规模缺陷或您的计划
通过创建各种级别或要求的路线图,通过检查点与您的团队和赞助商进行沟通
对于即使是中小型企业搜索项目的预先规划,我强烈推荐Martin White的“让搜索工作”。
我认为您会发现排名和相关性是获得优质搜索解决方案的最佳部分之一。引擎可能提供类似的功能,但是如何实现它的细节会有所不同,更重要的是,强制相关性的成功只会部分地取决于您选择的搜索引擎。换句话说,如果您的文本与搜索引擎算法不一致,您将花费大量时间尝试理解各种调整参数及其组合。 (到目前为止我只熟悉2,所以欢迎其他人反驳这一点。)
这是一次很棒的学习经历。祝你好运。
答案 4 :(得分:0)
FAST是一款出色的企业搜索产品。它通常在所有咨询公司评估中排名第一。它确实需要适量的技术设置和支持。
谷歌是另一个坚实的产品,但它非常昂贵。它需要较少的技术支持,但也可以减少对搜索结果的控制。