我的理解是Elasticsearch会存储文档的最新副本并只更新版本字段编号?但我正在玩几千个文档,需要重复索引它们而不改变文档中的任何数据。我的想法是索引大小将保持不变,但情况并非如此......索引大小似乎增加了。
这让我感到困惑,所以我只想澄清一下弹性搜索中版本控制的内部机制。
答案 0 :(得分:1)
更新是场景后面的Delete + Insert Lucene操作。 但是您应该知道Lucene并没有真正删除该文档,而是将其标记为已删除。
要删除已删除的文档,您必须优化Lucene细分。
$ curl -XPOST 'http://localhost:9200/twitter/_optimize?only_expunge_deletes=true'
见Optimize API。另请查看merge options。合并细分在某个时间发生在幕后。
有关Elasticsearch中版本控制支持的一般概述,请参阅Elasticsearch Versioning Support。