在Elasticsearch中,如何在没有整个对象的情况下返回整个嵌套字段?

时间:2016-07-18 15:40:47

标签: elasticsearch

我有一个映射,其中我有一个嵌套类型,嵌套对象通常包含多个对象,因此如果检索整个主对象,它就是一个数组。使用搜索请求的“字段”部分,我可以获取主对象的字段和嵌套对象中的字段(除了只有一个时,作为数组),但显然不是整个嵌套对象数组。除了获取整个对象(省略字段)之外,有没有办法做到这一点?

例如:

{ "properties: { "f1": {"type": "string"}, "f2": {"type": "string"}, ... "n": { "type": "nested", "properties": { "n1": {"type": "string"}, "n2": {"type": "string"}, ... } } } }

通常,n将是一个数组,但可能不会为所有条目设置n1

此查询有效,但由于在数组中的某些对象中缺少n1,因此无效:

{"query": {"nested": {"path": "n", "query": {"match": {"n.n1","something"}}}}, "fields": ["f1", "n.n1"]}

这不是(“field [n]不是叶子字段”),但是我真正想要的是:

{"query": {"nested": {"path": "n", "query": {"match": {"n.n1","something"}}}}, "fields": ["f1", "n"]}

但是这样做,代价是检索包括(数组)n:

在内的整个对象

{"query": {"nested": {"path": "n", "query": {"match": {"n.n1","something"}}}}}

当缺少n个匹配项中的字段时,是否存在一些我缺少的查询语法,它会给我整个数组n(以及主对象中的至少一个字符串字段),而不会得到整个匹配对象

1 个答案:

答案 0 :(得分:3)

我认为您想要的可能是Inner_Hits https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-inner-hits.html#top-level-inner-hits

基本上,您可以执行一个查询,它只返回与您的查询匹配的嵌套对象,而不是每个" parent"的所有嵌套对象。与您的查询匹配的对象。

将其与_source: false标志相结合,我认为你或多或少地得到了你想要的东西。

以下是一个例子:

  "_source": "false",
  "query": {
        "match": {
          "n.n1": "something"
        }
      },
  "inner_hits": {
  "myname": {
    "path": {
      "n": {
        "query": {
          "match": {
            "n.n1": "something"
          }
        }
      }
    }
  }
}

顶级查询将为您提供包含n.n1 contains "something"的任何内部文档的所有父文档。然后,内部查询还将该数组过滤为仅具有n.n1 contains "something"的内部文档。如果您实际上根本不想过滤Inner_hits,那么即使n1为空,您也只想要所有内容,然后只需将内部点击查询更改为match_all

这会给你一些回复:

 {
    "_index": "myindex",
    "_type": "mytype",
    "_id": "theid",
    "_score": 1,
    "inner_hits": {
      "myname": {
        "hits": {
          "total": 2,
          "max_score": 2.4890606,
          "hits": [
            {
              "_index": "myindex",
              "_type": "mytype",
              "_id": "2",
              "_nested": {
                "field": "n",
                "offset": 1
              },
              "_score": 2.4890606,
              "_source": {
                "n1": "something",
                "n2": "whatever"
              }
            },
            {
              "_index": "myindex",
              "_type": "mytype",
              "_id": "3",
              "_nested": {
                "field": "n",
                "offset": 0
              },
              "_score": 2.4890606,
              "_source": {
                "n1": "something",
                "n2": "great"
              }
            }
          ]
        }
      }
    }
  }

如果有什么不清楚,请告诉我。

编辑:

根据我的评论,这是一个例子:

{

"fields": ["f1"], 
  "query": {
    "match": {
      "n.n1": "something"
    }
  },
  "inner_hits": {
    "myname": {
      "path": {
        "n": {
          "query": {
           "match_all" : {}
          }
        }
      }
    }
  }
}

该查询将为您提供所有包含任何子项的父文档,其中n.n1包含"某些内容"。内部命中查询将为您提供父母的所有孩子,包括那些n.n1不包含"某些"的孩子。 fields标志表示只返回父文档的选定字段。