我的目标是建立一个新闻提要和博客提要的聚合器,以便制作 轻松搜索/跟踪权利。我一直在寻找许多解决方案,如Terrier,Lucene,SWISH-E等。
基本上,我只能在这些引擎上找到2个对比研究来源,其中一个有点过时了。基本上我想要一个搜索引擎,它将用于数据大小不是太大的情况,但索引将是频繁的,每30分钟左右。我觉得Terrier不是一个很好用的工具。当数据大小较大且更新频率较低时,它可以更好地工作。在信息检索领域工作过的人可以提供一些建议吗?
答案 0 :(得分:3)
Lucene是众所周知的,并且个人支持,这将是我的第一选择。
答案 1 :(得分:1)
如果您找到了现成的搜索引擎,请查看fastcatsearch。
它已经开发用于商业搜索,并应用于许多不同的网站。
比lucene更快,并且可以轻松使用基于Web的Web管理器。
在github中托管,并检查出来。 https://github.com/fastcatgroup/fastcatsearch