我有一个带有字段描述的索引,其分析如下:
"description":{
"analyzer" : "english",
"type" : "string"
}
我在一个名为synonyms.txt的文件中定义了一个同义词词典,其中包含:
ipod, i-pod, i pod => i-pod
我想将这个同义词词典添加到我的分析器中,但我不知道该怎么做。我应该定义自定义分析仪吗?但是如果我这样做,我会因为customisation.index
而偏离我目前的索引答案 0 :(得分:5)
是的,您应该定义自定义分析器。您可以从standard English analyzer开始,并将同义词过滤器添加到:
{
"settings": {
"analysis": {
"filter": {
"english_stop": {
"type": "stop",
"stopwords": "_english_"
},
"english_keywords": {
"type": "keyword_marker",
"keywords": []
},
"english_stemmer": {
"type": "stemmer",
"language": "english"
},
"english_possessive_stemmer": {
"type": "stemmer",
"language": "possessive_english"
},
"my_synonyms" : {
"type" : "synonym",
"synonyms_path" : "path/to/synonym.txt"
}
},
"analyzer": {
"custom_english": {
"tokenizer": "standard",
"filter": [
"english_possessive_stemmer",
"lowercase",
"my_synonyms",
"english_stop",
"english_keywords",
"english_stemmer"
]
}
}
}
}
}
至于它是否会分歧,是的。如果您将同义词应用为索引时间,则新索引的数据将应用同义词过滤器,而现有数据则不会。如果希望对索引时间分析进行一致的更改,则需要重新索引数据。
如果对分析的更改仅在您的search_analyzer
中,则无需重新编制索引。