如何找出elasticsearch解析query_string的结果?

时间:2013-08-23 10:23:47

标签: lucene elasticsearch

有没有办法通过elasticsearch API找出实际解析query string query的方法?您可以通过查看lucene query syntax手动执行此操作,但如果您可以查看解析器的实际结果的某些表示,那将非常好。

1 个答案:

答案 0 :(得分:5)

正如javanna在评论中提到的_validate api。这是什么适用于我的本地弹性(版本1.6):

curl -XGET 'http://localhost:9201/pl/_validate/query?explain&pretty' -d'
{
  "query": {
      "query_string": {
      "query": "a OR (b AND c) OR (d AND NOT(e or f))",
      "default_field": "t"
    }
  }
}
'

pl是我的群集上的索引名称。不同的索引可能有不同的分析器,这就是查询验证在索引范围内执行的原因。

以上卷曲的结果如下:

{
  "valid" : true,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "failed" : 0
  },
  "explanations" : [ {
    "index" : "pl",
    "valid" : true,
    "explanation" : "filtered(t:a (+t:b +t:c) (+t:d -(t:e t:or t:f)))->cache(org.elasticsearch.index.search.nested.NonNestedDocsFilter@ce2d82f1)"
  } ]
}

我故意制作了一个OR小写字母,正如您在解释中所看到的那样,它被解释为令牌而不是操作符。

至于解释的解释。格式类似于+-查询的query string operators

  • (和)字符的开头和结尾bool query
  • + prefix表示将在must
  • 中的子句
  • - 前缀表示将在must_not
  • 中的子句
  • 没有前缀表示它位于shoulddefault_operator等于OR

所以上面将等同于以下内容:

{
  "bool" : {
    "should" : [
      {
        "term" : { "t" : "a" }
      },
      {
        "bool": {
          "must": [
            {
              "term" : { "t" : "b" }
            },
            {
              "term" : { "t" : "c" }
            }
          ]
        }
      },
      {
        "bool": {
          "must": {
              "term" : { "t" : "d" }
          },
          "must_not": {
            "bool": {
              "should": [
                {
                  "term" : { "t" : "e" }
                },
                {
                  "term" : { "t" : "or" }
                },
                {
                  "term" : { "t" : "f" }
                }
              ]
            }
          }
        }
      }
    ]
  }
}

我使用_validate api来调试具有许多条件的复杂filtered查询。如果您想检查分析器如何标记输入(如url)或缓存某些过滤器,这将非常有用。

还有一个令人敬畏的参数rewrite,直到现在我才知道,这使得解释更加详细,显示了将要执行的实际Lucene查询。