我应该采用哪种优化策略对Elasticsearch进行严格的不间断索引?

时间:2016-01-04 19:25:00

标签: optimization indexing elasticsearch

我有一个搜索引擎应用程序,可以不断解析提要并在ES(版本1.5.2)中索引结果。

我平均有350万个索引文档。 删除文档的百分比有时约为40%,我在索引(批量)时会有一些请求超时。

  • 我应该采取哪种优化政策?

  • 我是否必须每天停止一次或多次索引到
    优化索引并减少已删除文档的百分比 合并细分?

  • 优化过程是否会影响查询?

我想知道哪种情况最适合这种情况。

我使用的是自定义_id,我知道它存在性能问题,但不能随意更改它。

提前致谢

1 个答案:

答案 0 :(得分:0)

如果您的某些批量索引请求超时,则表明您需要降低索引速率。 Elasticsearch大师建议不要使用优化API。在后台细分中,会发生合并,负责自动删除已删除的文档。如果您具有较高的索引速率,也不要使用优化API。这只会导致更多的索引请求超时。是的,优化也会对搜索性能产生负面影响,因为它是一种资源密集型操作。

简而言之,只需降低索引率即可。这应该解决你在这里提到的大多数问题。请求不会超时,删除的文档百分比也可能会下降。