答案 0 :(得分:0)
这就是雪球分析仪的工作原理。它太过激进了。根据我自己的经验,我倾向于使用修改后的English analyzer
stemmer
过滤器,因为它过于激进了。就像雪球一样kstem
,这是一个轻量级的英文过滤器。干得好。hunspell
字典标记过滤器来规范化单词(而不是stemmer
)asciifolding
过滤器来规范化字母,因此rôle
和role
之类的内容会相等。就是这样:
{
"settings": {
"analysis": {
"filter": {
"english_hunspell" : {
"type" : "hunspell",
"language" : "en_GB"
},
"english_stop": {
"type": "stop",
"stopwords": "_english_"
},
"english_possessive_stemmer": {
"type": "stemmer",
"language": "possessive_english"
}
},
"analyzer": {
"english": {
"tokenizer": "standard",
"filter": [
"asciifolding",
"english_possessive_stemmer",
"lowercase",
"english_stop",
"kstem",
"english_hunspell"
]
}
}
}
}
}