我使用以下设置创建ES索引。
"settings": {
"analysis" : {
"analyzer" : {
"my_analyzer" : {
"tokenizer" : "standard",
"filter" : ["standard", "lowercase", "my_stemmer"]
}
},
"filter" : {
"my_stemmer" : {
"type" : "stemmer",
"name" : "english"
}
}
}
}
我注意到,在分析词干分析器时,用词干替换原始字符串。有没有办法索引原始字符串和词干标记?
答案 0 :(得分:2)
您的问题是关于stemmer token filter的 您会找到“preserve_original”,例如Word Delimiter Token Filter但不适用于词干分析器过滤器。 如果您需要原始字词,例如对于聚合,您可以使用合适的分析仪将copy字段转换为另一个字段。 如果您需要在索引的相同位置使用原始文件,则必须包裹词干分析器并构建自己的分析器plugin。