我在理解ElasticSearch索引过程时遇到了一个问题。我已经读过this article,它说,反向索引存储了所有文档的所有标记,并且它是不可变的。因此,要更新它,我们必须删除它并重新索引所有数据以使所有文档都可搜索。
但我已经阅读了有关部分更新文档的信息(自动将它们标记为“已删除”并插入+索引新文档)。但在那些没有提及重新索引所有以前的数据的文章中。
所以,我接下来并不理解:当我更新文档(文本文档有10万个单词)并且已经存储了一些其他索引文档时 - 我是否会在每次UPDATE或INSERT操作重建索引过程中都这样做我的所有文件?
基本上我依赖默认的ElasticSearch设置(5个主分片,每个分片有一个副本,群集有2个节点)
答案 0 :(得分:1)
您可以更新文档(重新编制索引,这与从索引中删除并再次添加)基本相同,请参阅:http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/update-doc.html这将处理整个索引,因此您赢了'需要重新索引每个其他文档。
我不确定“保存”操作的含义,您可能想用一个例子来澄清它。
截至更新100K字的文件所需的时间,我建议您试一试。