我是一名非盈利组织的志愿者,首席执行官想要一份存储大学教授简历的申请表。简历应该是可搜索的,以便可能的雇主找到它们。简历可以采用各种格式,包括pdf或Word。
该网站目前基于Joomla!,但可能转移到Drupal。在任何一种情况下,开发人员都熟悉PHP。我熟悉PHP和Java。
此应用程序的最佳架构是什么?我在考虑:
如果我遗漏了任何可能性,请告诉我。
另外,我在亚马逊上找不到关于Solr的好书。然而,Lucene有一个很好的(In Action系列)。不幸的是,它只是简单地提到索尔。为了理解如何更好地使用Solr,或者我是在浪费我的时间/金钱,是否值得阅读一本关于Lucene的好书?我也找不到关于索尔的好书...但也许你可以推荐一本。
答案 0 :(得分:2)
是的,索尔是一个很好的比赛:
选择Solr不仅仅是关于它的性能,还有它的功能和灵活性。
关于Solr书籍,请参阅:
关于Lucene的书籍将帮助您了解文本的处理方式,如果您需要微调文本分析,这可能会派上用场,但我建议您从一本关于Solr的书开始。
答案 1 :(得分:0)
Solr是一个很好的选择,但是根据你的要求,我建议你选择Sphinx搜索引擎,它有一个非常好的文档PHP API。请注意,我喜欢Solr的一些很棒的功能,但Solr无法在索引算法(即磁盘上的索引时间和索引大小)方面击败Sphinx。
Solr - Solr 1.4企业级搜索服务器[PACKT PUBLISHING]上有一本很好的书。您还可以通过IBM Developer阅读有关Solr的精彩文章。在Google上搜索“使用Solr IBM Developerworks搜索智能”。
PS:我觉得Sphinx对你来说是最好的选择。答案 2 :(得分:-1)
根据你的解释,没有Solr不是一个好搭档。
如果需要,您将能够通过mysql进行全文搜索。您提到Joomla和Drupal这一事实显然表明您正在使用RDMS。
如果我重新启动这个项目,我可能会使用一些noSQL引擎,比如MongoDB来创建我的简历文档。 www.mongodb.com
这就是我坚持我的数据的方式。
如果它想要搜索文档,我只会考虑使用Solr,如果我希望每天有成千上万的搜索。如果您每天只需要100-1000次搜索,那么它实际上不需要实施Solr应用程序。
而且,为了回答你关于Solr的书籍问题,我拥有并推荐的这本书是http://www.packtpub.com/solr-1-4-enterprise-search-server/book,但我相信你可能会找到一些更新的东西。我在18-24个月前购买了它。
您首先要存储每个人的详细信息......所以