在ElasticSearch中查询DSL - 术语查询

时间:2016-07-04 09:42:12

标签: python elasticsearch querydsl

我是弹性搜索中查询DSL的新手。我正在尝试使用python来查询Elastic Search中的索引。 下面是我试图使用查询过滤的文档。

{u'_id': u'5',
    u'_index': u'data',
    u'_score': 1.0,
    u'_source': {u'attributes': {u'Accepts Credit Cards': False,
      u'Parking': {u'garage': False,
       u'lot': False,
       u'street': False,
       u'valet': False,
       u'validated': False},
      u'Price Range': 2},
     u'business_id': u'HZdLhv6COCleJMo7nPl-RA',
     u'categories': [u'Shopping',
      u'Home Services',
      u'Internet Service Providers',
      u'Mobile Phones',
      u'Professional Services',
      u'Electronics'],
     u'city': u'Pittsburgh',
     u'full_address': u'301 South Hills Village\nPittsburgh, PA 15241',
     u'hours': {u'Friday': {u'close': u'17:00', u'open': u'10:00'},
      u'Monday': {u'close': u'21:00', u'open': u'10:00'},
      u'Saturday': {u'close': u'21:00', u'open': u'10:00'},
      u'Sunday': {u'close': u'18:00', u'open': u'11:00'},
      u'Thursday': {u'close': u'17:00', u'open': u'10:00'},
      u'Tuesday': {u'close': u'21:00', u'open': u'10:00'},
      u'Wednesday': {u'close': u'21:00', u'open': u'10:00'}},
     u'latitude': 40.35762,
     u'longitude': -80.05998,
     u'name': u'Verizon',
     u'neighborhoods': [],
     u'open': True,
     u'review_count': 5,
     u'stars': 2.5,
     u'state': u'PA',
     u'type': u'business'},
    u'_type': u'business'}

要获取此文档,我在python中使用以下过滤器查询:

es.search(index = 'data', doc_type = 'business', body = {
'query' : {
    'filtered' : {
                'filter' : {
                            'bool' : {
                                    'must' : {'term' : {'name' : 'Verizon'}}
                                    }
                            }
                }
            }
})

但我对此查询没有任何打击。以下是我得到的结果:

{u'_shards': {u'failed': 0, u'successful': 5, u'total': 5},
 u'hits': {u'hits': [], u'max_score': None, u'total': 0},
 u'timed_out': False,
 u'took': 1}

但是如果在查询中,我将“term”替换为“match”,它会给出我想要的结果。让我知道我在哪里犯了错误。

1 个答案:

答案 0 :(得分:0)

除非您将字段“name”的映射指定为{“index”:“not_analyzed”},否则它将默认为“已分析”,这意味着索引时字符串值将被“分解”便于全文搜索。

“term”查询将查找文本的完全匹配,但如果“Verizon”被索引为[“Ver”,“izon”],则情况并非如此。我对文本如何分解的具体细节并不十分熟悉,但根据您的示例,这似乎是个问题。

一个好的起点是将“term”用于“not_analyzed”字段,并将“匹配”用于“已分析”字段。