在Elasticsearch

时间:2016-07-27 14:13:56

标签: elasticsearch

我有以下分析设置:

"settings" : { 
  "index" : { 
    "creation_date" : "1469213620697",
    "analysis" : { 
      "filter" : { 
        "stem_possessive_filter" : { 
          "name" : "possessive_english",
          "type" : "stemmer"
        }   
      },  
      "analyzer" : { 
        "stem_analyzer" : { 
          "filter" : [ "standard", "lowercase", "stem_possessive_filter" ],
          "tokenizer" : "standard"
        }   
      }   
    },  
    "number_of_shards" : "5",
    "number_of_replicas" : "1",
    "uuid" : "VQgaaZquQUOqKNYxGPH7cg",
    "version" : { 
      "created" : "2020199"
    }   
  }
},

字符串类型的每个字段都有以下映射:

"field_name" : {
   "type" : "string",
    "analyzer" : "stem_analyzer",
    "search_analyzer" : "standard"
 }

我希望能够在阿尔茨海默病 或 老年痴呆症的 短语中写出 老年痴呆症。结果,我想在老年痴呆症中得到 老年痴呆症

如果不使用占有权,

Multi match query不起作用:

{'query': {'multi_match': {'query': "dementia in alzheimer", 'type': 'phrase', 'fields': ['_all']}}}

但如果使用占有权,它就有效:

{'query': {'multi_match': {'query': "dementia in alzheimer's", 'type': 'phrase', 'fields': ['_all']}}}

另一方面,如果不使用占有权,Bool query会起作用:

{'query': {'bool': {'must': [{'match_phrase': {'Diagnosis': "dementia in alzheimer"}}]}}}

但如果使用占有权则不起作用:

{'query': {'bool': {'must': [{'match_phrase': {'Diagnosis': "dementia in alzheimer's"}}]}}}

如何使上述所有查询都有效?

- 更新 -

如果在查询中添加stem_analyzer,则bool查询有效。因此,您在搜索过程中使用它。我得到一个有和没有占有的短语的结果。 mybody = {'query': {'bool': {'must': [{'match_phrase': {'Diagnosis': {'query': "dementia in alzheimer's", 'analyzer': 'stem_analyzer'}}}]}}}

但是,如果添加分析器,多匹配查询将停止工作。无论是否有占有,我都没有得到任何结果。 {'query': {'multi_match': {'query': "dementia in alzheimer's", 'type': 'phrase', 'analyzer': 'stem_analyzer', 'fields': ['_all']}}}

为什么分析器不适用于多重匹配查询?

1 个答案:

答案 0 :(得分:0)

phrase类型不适用于多重匹配查询的词干分析器。但phrase_prefix类型有效。坦率地说,我不知道为什么。 documentation中没有任何暗示。

因此,以下两个多匹配查询为我返回相同的结果:

{'query': {'multi_match': {'query': "dementia in alzheimer", 'type': 'phrase_prefix', 'analyzer': 'stem_analyzer', 'fields': ['_all']}}}

{'query': {'multi_match': {'query': "dementia in alzheimer's", 'type': 'phrase_prefix', 'analyzer': 'stem_analyzer', 'fields': ['_all']}}}

在布尔查询中,match_phrase适用于词干分析器。 以下两个查询返回相同的结果:

{'query': {'bool': {'must': [{'match_phrase': {'Diagnosis': {'query': "dementia in alzheimer", 'analyzer': 'stem_analyzer'}}}]}}}

{'query': {'bool': {'must': [{'match_phrase': {'Diagnosis': {'query': "dementia in alzheimer's", 'analyzer': 'stem_analyzer'}}}]}}}