我正在编写一个使用kafka,storm和elasticsearch的实时分析工具,并希望一个针对大约50K /秒插入进行优化的弹性搜索。出于POC的目的,我尝试将批量文档插入到elasticsearch中,每秒获得10K插入。
我在一大盒亚马逊ec2上运行ES。 我调整了以下属性:
indices.memory.index_buffer_size: 30%
indices.memory.min_shard_index_buffer_size: 30mb
indices.memory.min_index_buffer_size: 96mb
threadpool.bulk.type: fixed
threadpool.bulk.size: 100
threadpool.bulk.queue_size: 2000
bootstrap.mlockall: true
但是我希望写入性能按50Ks而不是10Ks来确保我的风暴拓扑的正常流动。任何人都可以建议如何配置重写优化ES集群。