Question

我使用以下设置创建ES索引。

"settings": {
    "analysis" : {
        "analyzer" : {
            "my_analyzer" : {
                "tokenizer" : "standard",
                "filter" : ["standard", "lowercase", "my_stemmer"]
            }
        },
        "filter" : {
            "my_stemmer" : {
                "type" : "stemmer",
                "name" : "english"
            }
        }
    }
}

我注意到，在分析词干分析器时，用词干替换原始字符串。有没有办法索引原始字符串和词干标记？

Answer 1

您的问题是关于stemmer token filter的

您会找到“preserve_original”，例如Word Delimiter Token Filter但不适用于词干分析器过滤器。

如果您需要原始字词，例如对于聚合，您可以使用合适的分析仪将copy字段转换为另一个字段。

如果您需要在索引的相同位置使用原始文件，则必须包裹词干分析器并构建自己的分析器plugin。

用弹性搜索来代替原始字符串

1 个答案: