如果在索引已经运行时运行ElasticSearch索引会发生什么?

时间:2016-07-01 11:41:06

标签: json search elasticsearch elasticsearch-plugin

我有一个每小时的工作,将数据库中的数据索引到ElasticSearch,但似乎索引花了一个多小时。

如果第二个索引在另一个索引仍在运行时会发生什么?是否有可能出现的问题?

2 个答案:

答案 0 :(得分:1)

我认为这个问题有点模糊......

如果你在索引数据期间的工作中没有指定_id - 你会产生重复 - 这是非常糟糕的情况。
但是如果你指定_id,你只会重复索引相同的文档几次 - 它不是那么糟糕,但它对你的服务器来说是额外的,不必要的工作。
但是如果你的工作消耗了大量的资源(cpu,内存等),你的服务器可能会过载......

答案 1 :(得分:0)

什么都不应该发生。 Elasticsearch可以轻松处理这个问题。我的建议是从另一方面看这个问题。也许最好尝试改进同步。例如将插入注册到队列,然后将其扩展到多个工作者。顺便说一句,你是否使用批量插入?