Solr是解决下述问题的好方法吗?

时间:2011-08-23 23:26:43

标签: php apache drupal lucene solr

我是一名非盈利组织的志愿者,首席执行官想要一份存储大学教授简历的申请表。简历应该是可搜索的,以便可能的雇主找到它们。简历可以采用各种格式,包括pdf或Word。

该网站目前基于Joomla!,但可能转移到Drupal。在任何一种情况下,开发人员都熟悉PHP。我熟悉PHP和Java。

此应用程序的最佳架构是什么?我在考虑:

  1. 安装SOLR的Java或PHP版本并链接到它 通过PHP,使用PHP Solr扩展。
  2. 直接使用PHP版本的Lucene并绕过Solr。
  3. 使用Search Lucene API Drupal扩展,它提供类似Solr的功能。
  4. 如果我遗漏了任何可能性,请告诉我。

    另外,我在亚马逊上找不到关于Solr的好书。然而,Lucene有一个很好的(In Action系列)。不幸的是,它只是简单地提到索尔。为了理解如何更好地使用Solr,或者我是在浪费我的时间/金钱,是否值得阅读一本关于Lucene的好书?我也找不到关于索尔的好书...但也许你可以推荐一本。

3 个答案:

答案 0 :(得分:2)

是的,索尔是一个很好的比赛:

选择Solr不仅仅是关于它的性能,还有它的功能和灵活性。

关于Solr书籍,请参阅:

关于Lucene的书籍将帮助您了解文本的处理方式,如果您需要微调文本分析,这可能会派上用场,但我建议您从一本关于Solr的书开始。

答案 1 :(得分:0)

Solr是一个很好的选择,但是根据你的要求,我建议你选择Sphinx搜索引擎,它有一个非常好的文档PHP API。请注意,我喜欢Solr的一些很棒的功能,但Solr无法在索引算法(即磁盘上的索引时间和索引大小)方面击败Sphinx。

Solr - Solr 1.4企业级搜索服务器[PACKT PUBLISHING]上有一本很好的书。您还可以通过IBM Developer阅读有关Solr的精彩文章。在Google上搜索“使用Solr IBM Developerworks搜索智能”。

PS:我觉得Sphinx对你来说是最好的选择。

答案 2 :(得分:-1)

根据你的解释,没有Solr不是一个好搭档。

如果需要,您将能够通过mysql进行全文搜索。您提到Joomla和Drupal这一事实显然表明您正在使用RDMS。

如果我重新启动这个项目,我可能会使用一些noSQL引擎,比如MongoDB来创建我的简历文档。 www.mongodb.com

这就是我坚持我的数据的方式。

如果它想要搜索文档,我只会考虑使用Solr,如果我希望每天有成千上万的搜索。如果您每天只需要100-1000次搜索,那么它实际上不需要实施Solr应用程序。

而且,为了回答你关于Solr的书籍问题,我拥有并推荐的这本书是http://www.packtpub.com/solr-1-4-enterprise-search-server/book,但我相信你可能会找到一些更新的东西。我在18-24个月前购买了它。

您首先要存储每个人的详细信息......所以