我观看了有关提高索引性能的网站备忘录。 这是网站link
此链接指示我如何提高性能。但是,当我习惯使用elasticsearch-py批量生成python api时,它并没有提高elasticsearch中的索引速度。
即使所有配置更改都不会影响批量索引性能。
我使用并行进程或线程。每秒最大平均30000索引。
我有什么错?
主节点:1 数据节点:5包括主节点 CPU:Intel(R)Xeon(R)CPU E5645 @ 2.40GHz RAM:32G
ES_HEAPSIZE:10G
由于
答案 0 :(得分:5)
它实际上大大提高了性能(超过50%)。您只需要禁用refresh_interval(在完成数据索引时再次启用它)
curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "-1" }}'
#index data......
curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "1s" }}'