批量API ElasticSearch的“保持活跃”(SearchScroll API)和“批量大小”的最佳值

时间:2017-11-27 18:02:06

标签: elasticsearch

我需要在ES索引中重新索引数据(1.5亿个文档)。我将使用搜索和滚动API从旧索引获取数据(我不能使用reindex API,因为我们有旧的ES版本)并使用批量API将其复制到新索引上。 我的问题是

  • 我应该为滚动搜索的“保持活跃”时间提供最优化的值 - 1,2或5分钟?
  • 批量请求的批量大小的最佳值是什么 - 1000个元素或更多?
  • 我应该在一个批量请求中复制多少文档?

*更新: 我在索引中有4个分片

0 个答案:

没有答案