Question

我正在使用边缘ngram分析器。在检查字段的analyze API时，我得到以下结果。

例如对于查询＆＃34; galaxy j7＆＃34;，它被分析为。

["g","ga","gal","gala","galax","galaxy","j","j7"]

我希望如下分析数据。

["g","ga","gal","gala","galax","galaxy","galaxy j","galaxy j7"]

这怎么可能？

索引中的设置如下。

{
  "analysis": {
    "filter": {
        "autocomplete_filter": {
            "type": "edge_ngram",
            "min_gram": "1",
            "max_gram": "20"
        }
    },
    "analyzer": {
        "autocomplete_analyzer": {
            "filter": ["lowercase", "autocomplete_filter"],
            "type": "custom",
            "tokenizer": "standard"
        }
    }
  }
}

并且字段的映射在下面。

{
    "title_suggest": {
        "type": "string",
        "index_analyzer": "autocomplete_analyzer",
        "search_analyzer": "standard",
        "search_quote_analyzer": "autocomplete_analyzer"
    }
}

Answer 1

您需要使用edgeNGram tokenizer，而不是edge_ngram过滤器：

{
  "analysis": {
    "tokenizer": {
        "autocomplete_tokenizer": {
            "type": "edgeNGram",
            "min_gram": "1",
            "max_gram": "20"
        }
    },
    "analyzer": {
        "autocomplete_analyzer": {
            "filter": ["lowercase"],
            "type": "custom",
            "tokenizer": "autocomplete_tokenizer"
        }
    }
  }
}

如何使用包含空格的elasticsearch中的edge ngram索引数据？

1 个答案: