为什么不通过在elasticsearch中设置刷新间隔来提高性能

时间:2013-10-21 04:37:54

标签: performance indexing elasticsearch bulkinsert

我观看了有关提高索引性能的网站备忘录。 这是网站link

此链接指示我如何提高性能。但是,当我习惯使用elasticsearch-py批量生成python api时,它并没有提高elasticsearch中的索引速度。

即使所有配置更改都不会影响批量索引性能。

我使用并行进程或线程。每秒最大平均30000索引。

我有什么错?

主节点:1 数据节点:5包括主节点 CPU:Intel(R)Xeon(R)CPU E5645 @ 2.40GHz RAM:32G

ES_HEAPSIZE:10G

由于

1 个答案:

答案 0 :(得分:5)

它实际上大大提高了性能(超过50%)。您只需要禁用refresh_interval(在完成数据索引时再次启用它)

curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "-1"  }}'

#index data......

curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "1s"  }}'