我试图阻止重复的条目进入elasticsearch,但是基于数据中的一个参数。例如,如果我有一个像下面这样的对象,我想阻止另一个具有相同event_ids数组的条目。任何想法如何做到这一点?
如果它有任何区别,我会使用elasticsearch javascript API对此进行编码。
userSpaceOnUse
答案 0 :(得分:2)
您可以创建一个包含所有连接的事件ID的字符串,将其哈希,然后将其用作文档的ID。 您还应该排序和删除重复项。
所以例如:
sha1("5510380|5589253|5589254|5589255|5589256")
这样,具有相同事件的文档将获得相同的_id
。然后,您可以检查该文档是否存在。