在SolrCloud中保持索引优化/合并

时间:2013-07-22 17:55:17

标签: solr solrcloud

使用分布式Solr的主从实现(在Solr 4.x之前),它是一个直接设计的解决方案,拥有主要负载索引,合并和优化索引。然后索引被复制到副本,而副本同时总是提供搜索。

有人可以解释现在如何使用SolrCloud完成此操作? 似乎SolrCloud向leader的每个副本发送索引命令。但是如何才能实现搜索性能呢?对每个副本进行索引和搜索会在每个节点服务器上进行加载(在后台索引和运行合并线程),因为我的索引非常大,所以通常需要花费大量时间来合并段或简单地进行优化。 我现在应该提供所有合并政策而不用担心吗? TieredMergePolicy是否同时提供良好的搜索性能和低资源负载(CPU,I / O)?

1 个答案:

答案 0 :(得分:0)

我将尝试回答您的部分问题:SolrCloud确实在所有节点上编制索引,因此它会对副本产生性能影响。这是由于“热复制”模型而不是您习惯的“冷复制”而完成的。它解决了数据完整性问题以及群集上的实时搜索问题。作为性能影响的代价,您可以获得一致的数据和更快的数据可用性。实际上,您始终可以将数据拆分为分片(以额外硬件的价格),并具有相当的性能。 在任何一种情况下,由您决定SolrCloud是否适合您的需求。您可以在没有云模型的情况下使用Solr 4,并像以前一样自行管理。