ElasticSearch-dsl创建查询

时间:2019-03-14 19:29:27

标签: python elasticsearch elasticsearch-dsl

大家好:

很长时间以来,我一直在尝试使用ElasticSearch-dsl Search()类复制此查询,但不幸的是我无法获取它。

我要复制的查询是:

{
    "_source": {
            "includes": [ "SendingTime","Symbol","NoMDEntries","*"]
        },
        "from" : 0, "size" : 10000,
  "query": {
    "bool": {
      "must": [
        {
            "range": {
            "SendingTime": {
              "gte": "Oct 3, 2018 08:00:00 AM",
              "lt": "Oct 3, 2018 02:00:59 PM"
            }
          }
        }
      ]
    }
  }
}

日期时间最终将被变量替换。

到目前为止,我唯一能做的是:

search = Search(using=elastic_search, index="bcs-md-bmk-prod")\
    .query("bool", range= {"SendingTime" : {'gte': format_date(datetime.now() - relativedelta(days=1)), 'lt': format_date(datetime.now())}})\

我知道我真的很想得到我想要的东西,所以如果有人可以帮助我,我将不胜感激。

1 个答案:

答案 0 :(得分:0)

在elasticsearch-dsl中有多种方法构造相同的查询,这是为了方便用户,但有时(也许经常)使新用户更加困惑。

首先,每个原始查询与elasticsearch-dsl查询之间存在一对一匹配。例如,以下等同:

# 1
'query': {
    'multi_match': {
        'query': 'whatever you are looking for',
        'fields': ['title', 'content', 'footnote']
    }
}
# 2
from elasticsearch_dsl.query import MultiMatch
MultiMatch(query='whatever you are looking for', fields=['title', 'content', 'footnote'])

第二,这些对在elasticsearh-dsl中是等效的:

# 1 - using a class
from elasticsearch_dsl.query import MultiMatch
MultiMatch(query='whatever you are looking for', fields=['title', 'content', 'footnote'])
# 2 - using Q shortcut
Q('multi_match', query='whatever you are looking for', fields=['title', 'content', 'footnote'])

# 1 - using query type + keyword arguments 
Q('multi_match', query='elastic python', fields=['title', 'content', 'footnote'])
# 2 - using dict representation
Q({'multi_match': {'query': 'whatever your are looking for', 'fields': ['title', 'content', 'footnote']}})

# 1 - using Q shortcut
q = Q('multi_match', query='whatever your are looking for', fields=['title', 'content', 'footnote'])
s.query(q)
# 2 - using parameters for Q directly
s.query('multi_match', query='whatever your are looking for', fields=['title', 'content', 'footnote'])

现在,如果我们回想起bool query的结构,它由布尔子句组成,每个子句都有一个“类型化的出现”(必须,应有,must_not等)。由于每个子句也是一个“查询”(在您的情况下为range query),因此它遵循与“查询”相同的模式,这意味着它可以用Q快捷方式表示。

因此,我构建查询的方式是:

search = Search(using=elastic_search, index="bcs-md-bmk-prod")
          .query(Q('bool', must=[Q('range', SendingTime={"gte": "Oct 3, 2018 08:00:00 AM", "lt": "Oct 3, 2018 02:00:59 PM"})]))
          .source(includes=["SendingTime","Symbol","NoMDEntries","*"])

请注意,为简单起见,可以删除第一个Q,使该行如下:

.query('bool', must=[Q('range', SendingTime={"gte": "Oct 3, 2018 08:00:00 AM", "lt": "Oct 3, 2018 02:00:59 PM"})])

但是我用了它,所以更容易理解。随时在不同的表示形式之间进行权衡。

最后但并非最不重要的一点是,当您难以在Elasticsearch-dsl中构造查询时,可以始终使用from_dict()类的elasticsearch_dsl.Search方法来回退到原始dict表示形式。