在摄取数据时缓慢聚合查询

时间:2017-11-18 00:04:45

标签: performance elasticsearch

我有一个大的聚合查询,在我更新数据时非常慢。我没有将数据保存到tmp索引(然后在完成后重命名),而是将其直接保存到我查询的索引中。

  • 在建立索引时,有哪些方法可以改善查询性能?
  • 我在这里看到的常见瓶颈是什么(可能是记忆?)?

1 个答案:

答案 0 :(得分:1)

很难说没有任何细节,因为影响性能的因素很多。

一般来说,索引是一个计算密集型操作,所以尽管它可能会有违反直觉,但是看看如何改进搜索,我会看看如何优化你的索引以减少它导致的负载。

根据我的经验,我遇到了类似的问题。我观察到的是高IO利用率,而索引进度停止,搜索几乎无法获得。我通过调整与段和合并相关的配置获得了良好的结果,随着索引的增长,它会对旋转磁盘产生非常糟糕的影响,并开始合并大段。 此外,如果您对新文档的可用性没有严格要求,则更改 index.refresh_interval 和批处理文档以进行索引可能会有很大帮助。

在这里查看文档https://www.elastic.co/guide/en/elasticsearch/guide/2.x/indexing-performance.html