查找具有相同ID,不同类型

时间:2015-11-09 15:11:52

标签: elasticsearch duplicates

我需要查看是否有任何具有特定ID的文档已在我的ES数据库中编入索引,以便我可以在索引新文档之前将其删除。

麻烦的是我不知道它被索引为类型的先验。 我发现_mget查询听起来可能是我需要的,但是文档中的这句话说我在搜索时只获得1(随机)点击

  

如果您没有设置类型并且有许多文档共享相同的内容   _id,您最终只能获得第一个匹配的文档。

我怎样才能得到这种行为;找到共享_id的所有文档,可能> 1在同一索引中使用不同的_type而没有昂贵的_search查询?

谢谢!

1 个答案:

答案 0 :(得分:0)

"_id"上的简单term query为我工作。

所以我创建了一个简单的索引,并为两种不同的类型添加了两个文档:

PUT /test_index

POST /test_index/_bulk
{"index":{"_type":"type1","_id":1}}
{"name":"type1 doc1"}
{"index":{"_type":"type1","_id":2}}
{"name":"type1 doc2"}
{"index":{"_type":"type2","_id":1}}
{"name":"type2 doc1"}
{"index":{"_type":"type2","_id":2}}
{"name":"type2 doc2"}

此查询将返回ID为1的文档:

POST /test_index/_search
{
   "query": {
      "constant_score": {
         "filter": {
            "term": {
               "_id": "1"
            }
         }
      }
   }
}
...
{
   "took": 5,
   "timed_out": false,
   "_shards": {
      "total": 5,
      "successful": 5,
      "failed": 0
   },
   "hits": {
      "total": 2,
      "max_score": 1,
      "hits": [
         {
            "_index": "test_index",
            "_type": "type1",
            "_id": "1",
            "_score": 1,
            "_source": {
               "name": "type1 doc1"
            }
         },
         {
            "_index": "test_index",
            "_type": "type2",
            "_id": "1",
            "_score": 1,
            "_source": {
               "name": "type2 doc1"
            }
         }
      ]
   }
}

这是我使用的代码:

http://sense.qbox.io/gist/a8085b57c22631148dd4c67769307caf6425fd95