Solr:在索引操作期间,一些副本会崩溃

时间:2015-08-14 12:48:40

标签: solr lucene solrcloud

Replicas DOWN,全部在同一个SolrCloud节点上。它是一个双节点集群(但有三个zookeeper实例)。在索引操作期间会发生此问题。向下复制副本都在同一个solrcloud节点host2上。 我无法找到有关所引发错误的信息。 引发的错误如下:

ERROR - 2015-08-13 02:57:34.261; org.apache.solr.common.SolrException; forwarding update to http://host1:8080/solr/collection_V_2_0_shard1_replica1/ failed - retrying ... retries: 1 add{,id=RFQ||304707||188627||1} params:update.distrib=TOLEADER&distrib.from=http%3A%2F%2Fhost2%3A8080%2Fsolr%2Fak_collection_V_2_0_shard1_replica2%2F rsp:503:org.apache.solr.common.SolrException: Service Unavailable

错误发生后,collection_V_2_0_shard1_replica2已关闭。 有人可以帮我找到这个错误的原因吗?

此致 Giova

1 个答案:

答案 0 :(得分:0)

我想托管collection_V_2_0_shard1_replica2的SOLR节点由于某种原因而出现故障,日志中的错误与节点发生故障的原因无关,它是关于尝试将文档路由到shard1领导者的副本,看起来领导者已经失败了

一些调试技巧

  1. 登录托管shard1的节点
  2. 扫描日志文件并查看节点发生故障的原因,查找时间在路由时间戳之前(2015-08-13 02:57:34.261之前的Say Secs / Mins)
  3. 你是否覆盖了Java Heap ..? Defalut只有512KB,您可以在solr.in.sh/cmd中更改为4g并重新启动solr
  4. 那时候ZooKeepers起来了吗?即使zooKeeper已关闭,群集仍将维持,因为SOLR本身具有群集状态json。但它无法接受写作。