PHP Zend Lucene可以处理超过100万个文档的索引吗?

时间:2011-06-10 17:19:27

标签: php zend-framework lucene

是否有人知道有使用PHP Zend Lucene(搜索引擎)的经验,其存储库超过100万。

感谢您的反馈

Indexing with PHP Lucene with Java

3 个答案:

答案 0 :(得分:0)

我认为如果你想获得良好的性能,你可能需要考虑使用sphinx而不是PHP Zend Lucene,除非你的项目需要Lucene索引。

当我在大约一年前看到这个时,我找到了一些比较PHP Lucence和sphinx的基准。狮身人面像以远射获胜。

答案 1 :(得分:0)

很大程度上取决于应用程序的体系结构,但我不担心项目的数量。众所周知,Lucene在非常大型项目上的速度很慢(构建索引),但升级到Solr很好。

  

Solr是受欢迎的,快速开放的   来源企业搜索平台   Apache Lucene项目。它的主要   功能包括强大的全文   搜索,点击突出显示,刻面   搜索,动态聚类,数据库   整合,丰富的文件(例如,   Word,PDF)处理和地理空间   搜索。 Solr具有高度可扩展性,   提供分布式搜索和索引   复制,它为搜索提供动力   和导航功能的许多   世界上最大的互联网网站。

答案 2 :(得分:0)

我没有直接的经验,但我已经看到Zend Lucene既缓慢又内存密集的抱怨,以至于它实际上失败了“大”索引和“小”内存限制。当然,构成大型索引和小内存约束的是该问题的本质。

以下两个主题包含一些细节,似乎表明100万份文档可能会出现问题:

我尊重的其他开发者在速度和记忆方面都非常了解Sphinx

就个人而言,我正在考虑在一个小项目上试用Zend Lucene--索引中的文档可能不超过1,000个,因为我被限制为共享托管(据我所知,Sphinx需要一个外部守护进程)。但我仍然在指责。