Solrcloud&数据导入处理程序

时间:2015-06-22 11:50:55

标签: java solr apache-zookeeper solr4 solrcloud

我计划将Solr从单实例选项升级到云选项。目前我有5个核心,每个核心都配置了数据导入处理程序。我已经在tomcat文件夹中部署了web应用程序以及solr.war,这将触发完全导入& delta根据我的项目需求定期进口。

现在,我打算为这个应用程序创建2个分片,将5个核心数据的一半保留到每个分片中。我不明白DIH如何在SolrCloud中运行?

  • 如果我从两个分片开始完全索引,那可以吗?
  • 或者我只需要从一个分片中完整索引?

架构将如下所示 enter image description here

2 个答案:

答案 0 :(得分:0)

这完全取决于您如何创建solr云:使用复合ID或隐式路由。使用复合ID路由将负责跨所有可用分片传播文档。您可以从任何solr云节点启动导入。最后,云环境将包含分布在所有分片中的导入文档索引。 如果使用隐式路由,则可以控制每个文档索引的位置。 DI不必使用DIH。或者,您可以编写一个小应用程序,使用solr客户端填充索引,从而为您提供更多控制。

答案 1 :(得分:0)

经过大量的谷歌搜索和阅读后,我终于决定按如下方式实施DIH。如果您觉得这个架构存在问题,请告诉我您的意见。

enter image description here