用弹性搜索来代替原始字符串

时间:2017-10-06 15:56:30

标签: elasticsearch tokenize analyzer elasticsearch-5 stemming

我使用以下设置创建ES索引。

"settings": {
    "analysis" : {
        "analyzer" : {
            "my_analyzer" : {
                "tokenizer" : "standard",
                "filter" : ["standard", "lowercase", "my_stemmer"]
            }
        },
        "filter" : {
            "my_stemmer" : {
                "type" : "stemmer",
                "name" : "english"
            }
        }
    }
}

我注意到,在分析词干分析器时,用词干替换原始字符串。有没有办法索引原始字符串和词干标记?

1 个答案:

答案 0 :(得分:2)

您的问题是关于stemmer token filter

您会找到“preserve_original”,例如Word Delimiter Token Filter但不适用于词干分析器过滤器。

如果您需要原始字词,例如对于聚合,您可以使用合适的分析仪将copy字段转换为另一个字段。

如果您需要在索引的相同位置使用原始文件,则必须包裹词干分析器并构建自己的分析器plugin