在elasticsearch中查找重复的字段值

时间:2013-07-12 14:33:59

标签: elasticsearch

使用elasticsearch 0.19.4(我知道这是旧的,但它依赖于所需的内容)

我在弹性搜索索引中有一个字段“digest” - 我想执行一个查询,它将返回所有存在重复的摘要值的情况。可以这样做吗?

对于具有重复值的记录,我想返回其他值 - 例如“url”,这些值可能不会重复。

1 个答案:

答案 0 :(得分:3)

您可以使用Terms Aggregation

POST <index>/<type>/_search?search_type=count
{
    "aggs": {
       "duplicateNames": {
           "terms": {
               "field": "digest",
               "size": 0,
               "min_doc_count": 2
            }
        }
    }
}

这将返回至少2个文档中出现的字段digest的所有值。我同意这与您的用例不完全匹配,但它可能有所帮助。