Question

我们有一个项目索引，我试图在项目名称上做模糊通配符。查询

{
  "from": 0,
  "size": 10,
  "query": {
    "bool": {
      "must": {
        "query_string": {
          "fields": [
            "name.suggest"
          ],
          "query": "avacado*",
          "fuzziness": 0.7
        }
      }
    }
  }
}

索引中的字段和正在播放的分析器＆＃34;

suggest_analyzer":{
    "type": "custom",
    "tokenizer": "standard",
    "filter": ["standard", "lowercase", "shingle", "punctuation"]
  }


"punctuation" : {
    "type" : "word_delimiter",
    "preserve_original": "true"
  }



"name": {
    "fields": {
      "name": {
        "type": "string",
        "analyzer": "stem"
      },
      "suggest":{ 
        "type": "string", 
        "analyzer": "suggest_analyzer"
      },
      "untouched": {
        "include_in_all": false,
        "index": "not_analyzed",
        "index_options": "docs",
        "omit_norms": true,
        "type": "string"
      },
      "untouched_lowercase": {
        "type": "string", 
        "index_analyzer": "lowercase",
        "search_analyzer": "lowercase"
      }
    },
    "type": "multi_field"
  },

问题是这个

名为＆＃34; Avocado Test＆＃34;的项目将匹配以下

鳄梨*
AVO *
阿瓦克

但无法匹配

阿瓦克*
AVA *
AVA〜2

我似乎无法使用通配符进行模糊处理，它似乎是模糊的工作或通配符工作，但不是组合。

Es版本为1.3.1

请注意，我的查询已经过简化，我们正在进行其他过滤，但我将其简化为查询，以消除结果中的任何歧义。我尝试使用推荐功能，但他们不会允许我们需要的过滤级别。

有没有其他方法可以处理建议/先行式搜索模糊以捕捉拼写错误？

Answer 1

您可以尝试使用 EdgeNgramTokenFilter，在应用于所需字段的分析器上使用它并对其进行模糊搜索。

具有模糊性的Elasticsearch通配符查询字符串

1 个答案: