SolrCloud上完全重新索引的频率

时间:2017-12-28 19:05:42

标签: solr solrcloud reindex solr6 delta-index

我需要多长时间在SolrCloud上运行完全重新索引? 完全重新运行索引需要12个多小时才能运行,我们每晚运行它,但是当delta正确运行时,确实需要这样做。 新数据以每30秒每个增量的2000个文档的速率进入。 索引总大小:20GB Solr:6.5.2

1 个答案:

答案 0 :(得分:0)

如果delta正确运行,则根本不需要运行reindex。例外情况可能是您在索引有效时没有禁用任何合并;在这种情况下,您最终可能会得到一个非常分散的索引文件,而reindex最终会将完整的集合构建为单个索引文件,但通常不是如何配置Solr,如果是 - 它是为了原因。

所以 - 如果您的增量工作正常并且您使用相当标准的设置运行Solr,则可以安全地跳过重建索引,除非您重新开始使用空索引(或者具有模式已更改的情况)。但请确保这也包含删除 - reindex可能不会包含已删除的元素,因此问题就变成了delta导入是否也会处理删除。

我们所有基于Solr的服务都没有重新索引 - 一切都通过实时更新和合适的合并因素完成。