在没有重复参数的情况下在Elasticsearch中创建文档

时间:2016-01-08 22:45:33

标签: elasticsearch

我试图阻止重复的条目进入elasticsearch,但是基于数据中的一个参数。例如,如果我有一个像下面这样的对象,我想阻止另一个具有相同event_ids数组的条目。任何想法如何做到这一点?

如果它有任何区别,我会使用elasticsearch javascript API对此进行编码。

userSpaceOnUse

1 个答案:

答案 0 :(得分:2)

您可以创建一个包含所有连接的事件ID的字符串,将其哈希,然后将其用作文档的ID。 您还应该排序和删除重复项。

所以例如: sha1("5510380|5589253|5589254|5589255|5589256")

这样,具有相同事件的文档将获得相同的_id。然后,您可以检查该文档是否存在。