在分布式Solr配置中复制

时间:2011-11-03 00:31:06

标签: solr replication distributed

我正在尝试为Solr cloud中的每个从站添加复制,以使整个群集更可靠。我们的想法是将一个分片分散到多台机器上,即使其中一台机器出现故障,也可以让集群工作。

Solr具有出色的内置replication feature,在正常(非分布式)Solr设置中完美运行。但是,当向Solr云添加此功能时,我收到一个错误,告知找不到/solr/replication处理程序(实际上它在启动Solr时不出现在Solr输出中,尽管它在{{1}中定义})。

SolrWiki也指向distributed update handler,但是从作者的说明中我知道它实际上并不复制数据,只是将新文档发送到在config中定义的节点之一。

我的问题是:

  1. 为什么内置的基于Java的复制在分布式Solr设置中不起作用?这是Solr云的一个问题,更基本的问题还是我的配置中的错误(我多次检查过所有内容,但仍然可能会遗漏一些内容)?
  2. 在分布式Solr中复制的其他好方法是什么?

1 个答案:

答案 0 :(得分:1)

虽然我在这里参加一个老问题的派对有点迟了;答案是Solr Cloud在内部处理复制。 Solr Cloud wiki page详细解释了这一点。如果您已设置numShards = 2并添加更多服务器(因此总共有四个),则该分片将复制到新服务器 - 确保您的分片位于多个节点上。

直接回答你的问题;

  1. SolrCloud为您完成复制设置和逻辑,您应该让它自己做,而不是在混合中引入“手动”设置复制。

  2. SolrCloud的重点是隐藏复制和共享逻辑,允许您在可用时添加更多服务器。您当然可以创建逻辑上独立的云集群和两者的索引,但这不是必需的。