优化Elasticsearch索引

时间:2016-03-17 08:58:00

标签: elasticsearch

由于磁盘空间不足以及我的某个索引中有大量已删除的文档,我需要执行一个优化命令(ElasticSearch 1.7)

目前,该索引具有以下统计数据:

分片:15 * 1 | docs:23,165,760 |尺寸:1.25TB

  • 优化API会阻止任何索引/查询操作,直到优化完成吗?
  • 优化API是否会影响其他索引的操作?
  • 是否可以有一个大致的时间知道需要多长时间?

抱歉我的英语不好:)

如果您需要任何进一步的统计数据,请告诉我

1 个答案:

答案 0 :(得分:4)

  

优化API会阻止任何索引/查询操作,直到优化完成吗?

不,它可以并行运行,但索引过程会影响优化。创建了新细分,这些细分也受到优化......

  

优化API会影响其他索引的操作吗?

不是直接,而是间接使用额外的CPU,内存和磁盘。

  

是否有可能有大致的时间知道需要多长时间?

Nop :-),可能只是通过预先测试并推断出文档/细分的数量。

请注意优化需要额外的磁盘空间。如果优化到非常少的段,优化过程很可能会尝试最终优化一组非常大的段,这意味着它将需要一个额外的(largeSegment1_size + largeSegment2_size + ....)磁盘空间。仅当生成的合并段完成时,才会删除旧段。

另外,请查看only_expunge_deletes选项以获取替代方案。

另一个建议是在群集负载较少时执行优化。正如我所提到的,优化需要额外的CPU,内存和磁盘空间资源。