SolrCloud碎片恢复

时间:2014-08-02 18:32:16

标签: solrcloud

我是SolrCloud新手,我的设置是3个碎片,3个副本,外部Zookeeper

今天我发现了shard3,replica3已经接管了领导者,所以对replica3进行了索引而不是shard3。我以相反的顺序(R3,R2,R1,S3,S2,S1)停止了Tomcat / SOLR,并以正向顺序(S1,S2,S3,R1,R2,R3)重新启动。我没有删除任何tlog或replication.properties文件。云图显示所有主机的正确分配。据我了解,这些分配是在第一次启动时在Zookeeper中设置的。

我的问题是索引到replica3的数据是如何回到复活的shard3的?

令人惊讶的是,shard3 = 87G而replica3 = 80G。

困惑!

2 个答案:

答案 0 :(得分:2)

丹,

副本的大小并不重要,只有收集的文档数量。

Solr的工作方式,您可以在集合中删除仅在合并操作中删除的文档,这个额外的7G可以删除文档。

答案 1 :(得分:0)

1)据我所知,当shard3启动时,它的运行和运行是zookeeper,它在shard和replica3之间进行数据同步。

2)关于你的第二个问题,可能是replica3处于优化状态,因此你看到的数据量较少,而shard3尚未被SOLR优化。 (这只是一个疯狂的猜测)