ElasticSearch:每次更新后创建新的反向索引

时间:2015-02-24 12:29:59

标签: java elasticsearch lucene

我在理解ElasticSearch索引过程时遇到了一个问题。我已经读过this article,它说,反向索引存储了所有文档的所有标记,并且它是不可变的。因此,要更新它,我们必须删除它并重新索引所有数据以使所有文档都可搜索。

但我已经阅读了有关部分更新文档的信息(自动将它们标记为“已删除”并插入+索引新文档)。但在那些没有提及重新索引所有以前的数据的文章中。

所以,我接下来并不理解:当我更新文档(文本文档有10万个单词)并且已经存储了一些其他索引文档时 - 我是否会在每次UPDATE或INSERT操作重建索引过程中都这样做我的所有文件?

基本上我依赖默认的ElasticSearch设置(5个主分片,每个分片有一个副本,群集有2个节点)

1 个答案:

答案 0 :(得分:1)

您可以更新文档(重新编制索引,这与从索引中删除并再次添加)基本相同,请参阅:http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/update-doc.html这将处理整个索引,因此您赢了'需要重新索引每个其他文档。

我不确定“保存”操作的含义,您可能想用一个例子来澄清它。

截至更新100K字的文件所需的时间,我建议您试一试。