应用错误收集

在SolrCloud中保持索引优化/合并

时间：2013-07-22 17:55:17

标签： solr solrcloud

使用分布式Solr的主从实现（在Solr 4.x之前），它是一个直接设计的解决方案，拥有主要负载索引，合并和优化索引。然后索引被复制到副本，而副本同时总是提供搜索。

有人可以解释现在如何使用SolrCloud完成此操作？似乎SolrCloud向leader的每个副本发送索引命令。但是如何才能实现搜索性能呢？对每个副本进行索引和搜索会在每个节点服务器上进行加载（在后台索引和运行合并线程），因为我的索引非常大，所以通常需要花费大量时间来合并段或简单地进行优化。我现在应该提供所有合并政策而不用担心吗？ TieredMergePolicy是否同时提供良好的搜索性能和低资源负载（CPU，I / O）？

1 个答案:

答案 0 :(得分：0)

我将尝试回答您的部分问题：SolrCloud确实在所有节点上编制索引，因此它会对副本产生性能影响。这是由于“热复制”模型而不是您习惯的“冷复制”而完成的。它解决了数据完整性问题以及群集上的实时搜索问题。作为性能影响的代价，您可以获得一致的数据和更快的数据可用性。实际上，您始终可以将数据拆分为分片（以额外硬件的价格），并具有相当的性能。在任何一种情况下，由您决定SolrCloud是否适合您的需求。您可以在没有云模型的情况下使用Solr 4，并像以前一样自行管理。