我有一个拥有8800万个文档,0个副本,SSD上有1个分片的索引。当我使用reindex API(大小为3000,refresh_interval -1)时,当我们通过5000万大关时,它开始慢得慢。
我假设ES正在检查文件是否存在?有没有办法重新索引和剥离旧的文档ID,以便ES可以更快地生成新的文档和索引?
另外,我如何从特定点重新索引?我遇到的问题是我必须暂停新传入文档的队列,直到reindex完成,然后切换别名。如果我可以让源索引仍然获得新的文档然后开始新的重新索引来移动那些新闻文档,同时重新发生重新索引,那将是非常棒的。
答案 0 :(得分:0)
将floowing脚本添加到reindex调用以解决问题:
ctx.remove('_id');