由于磁盘空间不足以及我的某个索引中有大量已删除的文档,我需要执行一个优化命令(ElasticSearch 1.7)
目前,该索引具有以下统计数据:
分片:15 * 1 | docs:23,165,760 |尺寸:1.25TB
抱歉我的英语不好:)
如果您需要任何进一步的统计数据,请告诉我
答案 0 :(得分:4)
优化API会阻止任何索引/查询操作,直到优化完成吗?
不,它可以并行运行,但索引过程会影响优化。创建了新细分,这些细分也受到优化......
优化API会影响其他索引的操作吗?
不是直接,而是间接使用额外的CPU,内存和磁盘。
是否有可能有大致的时间知道需要多长时间?
Nop :-),可能只是通过预先测试并推断出文档/细分的数量。
请注意优化需要额外的磁盘空间。如果优化到非常少的段,优化过程很可能会尝试最终优化一组非常大的段,这意味着它将需要一个额外的(largeSegment1_size + largeSegment2_size + ....)磁盘空间。仅当生成的合并段完成时,才会删除旧段。
另外,请查看only_expunge_deletes选项以获取替代方案。
另一个建议是在群集负载较少时执行优化。正如我所提到的,优化需要额外的CPU,内存和磁盘空间资源。