非常感谢@Random,我修改了映射如下。为了测试,我使用了#34;电影"作为我的索引类型。 注意:我也添加了search_analyzer。没有它,我没有得到适当的结果。 但是我对使用search_analyzer有疑问。
1]我们可以在语言分析器的情况下使用自定义search_analyzer吗? 2]我是否因为使用了n-gram分析仪得到了所有结果而不是英语分析器?
{
"settings": {
"analysis": {
"analyzer": {
"english_ngram": {
"type": "custom",
"filter": [
"english_possessive_stemmer",
"lowercase",
"english_stop",
"english_stemmer",
"ngram_filter"
],
"tokenizer": "whitespace"
},
"search_analyzer":{
"type": "custom",
"tokenizer": "whitespace",
"filter": "lowercase"
}
},
"filter": {
"english_stop": {
"type": "stop"
},
"english_stemmer": {
"type": "stemmer",
"language": "english"
},
"english_possessive_stemmer": {
"type": "stemmer",
"language": "possessive_english"
},
"ngram_filter": {
"type": "ngram",
"min_gram": 1,
"max_gram": 25
}
}
}
},
"mappings": {
"movie": {
"properties": {
"title": {
"type": "string",
"fields": {
"en": {
"type": "string",
"analyzer": "english_ngram",
"search_analyzer": "search_analyzer"
}
}
}
}
}
}
}
更新:
使用搜索分析器也不能始终如一地工作。需要更多的帮助。用我的发现更新问题。
我按建议使用了以下映射(注意:此映射不使用搜索分析器),为简单起见,我们只考虑英文分析器。
{
"settings": {
"analysis": {
"analyzer": {
"english_ngram": {
"type": "custom",
"filter": [
"english_possessive_stemmer",
"lowercase",
"english_stop",
"english_stemmer",
"ngram_filter"
],
"tokenizer": "standard"
}
},
"filter": {
"english_stop": {
"type": "stop"
},
"english_stemmer": {
"type": "stemmer",
"language": "english"
},
"english_possessive_stemmer": {
"type": "stemmer",
"language": "possessive_english"
},
"ngram_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 25
}
}
}
}
}
创建索引:
PUT http://localhost:9200/movies/movie/1
{"title":"$peci@l movie"}
尝试以下查询:
GET http://localhost:9200/movies/movie/_search
{
"query": {
"multi_match": {
"query": "$peci mov",
"fields": ["title"],
"operator": "and"
}
}
}
}
我没有结果,我做错了什么? 我想获得结果:
1] Special characters
2] Partial matches
3] Space separated partial and full words
再次感谢!
答案 0 :(得分:1)
您可以根据语言分析器创建自定义分析器。唯一的区别是您将ngram_filter
令牌过滤器添加到链的末尾。在这种情况下,您首先会得到语言干扰的标记(默认链),最终转换为边缘图(您的过滤器)。您可以在https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html#english-analyzer找到语言分析器的实现,以便覆盖它们。以下是英语语言变化的一个示例:
{
"settings": {
"analysis": {
"analyzer": {
"english_ngram": {
"type": "custom",
"filter": [
"english_possessive_stemmer",
"lowercase",
"english_stop",
"english_stemmer",
"ngram_filter"
],
"tokenizer": "standard"
}
},
"filter": {
"english_stop": {
"type": "stop"
},
"english_stemmer": {
"type": "stemmer",
"language": "english"
},
"english_possessive_stemmer": {
"type": "stemmer",
"language": "possessive_english"
},
"ngram_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 25
}
}
}
}
}
<强>更新强>
要支持特殊字符,您可以尝试使用whitespace
tokenizer而不是standard
。在这种情况下,这些字符将成为您的令牌的一部分:
{
"settings": {
"analysis": {
"analyzer": {
"english_ngram": {
"type": "custom",
"filter": [
"english_possessive_stemmer",
"lowercase",
"english_stop",
"english_stemmer",
"ngram_filter"
],
"tokenizer": "whitespace"
}
},
"filter": {
"english_stop": {
"type": "stop"
},
"english_stemmer": {
"type": "stemmer",
"language": "english"
},
"english_possessive_stemmer": {
"type": "stemmer",
"language": "possessive_english"
},
"ngram_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 25
}
}
}
}
}