我可以在Elasticsearch索引的设置中使用多个过滤器吗?

时间:2016-06-01 20:07:24

标签: elasticsearch

我想要一个简单地存储功能“名称”的Elasticsearch索引。我希望能够分别发出语音查询和预先输入样式查询。我想我可以用两个分析器和两个过滤器创建一个索引;每个分析仪都可以使用其中一个过滤器。但我似乎无法做到这一点。

以下是我正在尝试使用的索引设置:

{
    "settings": {
        "number_of_shards": 1,
        "analysis": {
            "analyzer": {
                "autocomplete_analyzer": {
                    "type": "custom",
                    "tokenizer": "standard",
                    "filter": ["standard", "lowercase", "ngram"]
                }
            },
            "analyzer": {
                "phonetic_analyzer": {
                    "tokenizer": "standard",
                    "filter": "double_metaphone_filter"
                }
            },
            "filter": {
                "double_metaphone_filter": {
                    "type": "phonetic",
                    "encoder": "double_metaphone"
                }
            },
            "filter": {
                "ngram": {
                    "type": "ngram",
                    "min_gram": 2,
                    "max_gram": 15
                }
            }
        }
    }
}

当我尝试使用这些设置创建索引时:

http://hostname:9200/index/type

我得到一个HTTP 400,说

Custom Analyzer [phonetic_analyzer] failed to find filter under name [double_metaphone_filter]

不要误会我的意思,我完全明白那句话意味着什么。我查看并查找了错误的逗号或引号,但我没有看到任何。否则,一切都在那里并且格式正确。

如果我删除了拼音分析器,则会创建索引,但只能使用自动完成分析器和ngram过滤器。

如果删除ngram 过滤器,则会创建索引,但只能使用语音分析器和语音过滤器。

我有一种感觉我缺少ES的基本概念,例如每个索引只有一个分析器,或者每个索引一个过滤器,或者我必须正确设置其他逻辑依赖项等等。这肯定会很好有一个Elasticsearch基础设施的逻辑图或完整的API规范,即任何索引都可以有1..n分析器,只有1个过滤器,查询必须需要bool,match等中的任何一个。但是那个独角兽似乎不存在。 / p>

我看到大量关于如何执行这些功能的文档,博客文章等,但索引上只有一个分析器和一个过滤器。我真的很想在一个索引上做这个双重功能(原因超出范围)。

有人可以提供一些帮助吗?

1 个答案:

答案 0 :(得分:3)

您只是错过了设置对象的正确格式。您不能拥有两个analyzerfilter个键,因为此设置地图对象中每个键只能有一个值。提供过滤器列表似乎工作得很好。在创建索引对象时,第二个键覆盖了第一个键。

看这里:

"settings": {
    "number_of_shards": 1,
    "analysis": {
        "filter": {
            "double_metaphone_filter": {
                "type": "phonetic",
                "encoder": "double_metaphone"
            },
            "ngram": {
                "type": "ngram",
                "min_gram": 2,
                "max_gram": 15
            }
        },
        "analyzer": {
            "autocomplete_analyzer": {
                "type": "custom",
                "tokenizer": "standard",
                "filter": ["standard", "lowercase", "ngram"]
            },
            "phonetic_analyzer": {
                "tokenizer": "standard",
                "filter": "double_metaphone_filter"
            }
        }
    }
}

我下载了插件以确认这是有效的。 您现在可以使用有效负载在_analyze点进行测试:

{
    "analyzer":"autocomplete_analyzer",
    "text":"Jonnie Smythe"
}