我想要一个简单地存储功能“名称”的Elasticsearch索引。我希望能够分别发出语音查询和预先输入样式查询。我想我可以用两个分析器和两个过滤器创建一个索引;每个分析仪都可以使用其中一个过滤器。但我似乎无法做到这一点。
以下是我正在尝试使用的索引设置:
{
"settings": {
"number_of_shards": 1,
"analysis": {
"analyzer": {
"autocomplete_analyzer": {
"type": "custom",
"tokenizer": "standard",
"filter": ["standard", "lowercase", "ngram"]
}
},
"analyzer": {
"phonetic_analyzer": {
"tokenizer": "standard",
"filter": "double_metaphone_filter"
}
},
"filter": {
"double_metaphone_filter": {
"type": "phonetic",
"encoder": "double_metaphone"
}
},
"filter": {
"ngram": {
"type": "ngram",
"min_gram": 2,
"max_gram": 15
}
}
}
}
}
当我尝试使用这些设置创建索引时:
http://hostname:9200/index/type
我得到一个HTTP 400,说
Custom Analyzer [phonetic_analyzer] failed to find filter under name [double_metaphone_filter]
不要误会我的意思,我完全明白那句话意味着什么。我查看并查找了错误的逗号或引号,但我没有看到任何。否则,一切都在那里并且格式正确。
如果我删除了拼音分析器,则会创建索引,但只能使用自动完成分析器和ngram过滤器。
如果删除ngram 过滤器,则会创建索引,但只能使用语音分析器和语音过滤器。
我有一种感觉我缺少ES的基本概念,例如每个索引只有一个分析器,或者每个索引一个过滤器,或者我必须正确设置其他逻辑依赖项等等。这肯定会很好有一个Elasticsearch基础设施的逻辑图或完整的API规范,即任何索引都可以有1..n分析器,只有1个过滤器,查询必须需要bool,match等中的任何一个。但是那个独角兽似乎不存在。 / p>
我看到大量关于如何执行这些功能的文档,博客文章等,但索引上只有一个分析器和一个过滤器。我真的很想在一个索引上做这个双重功能(原因超出范围)。
有人可以提供一些帮助吗?
答案 0 :(得分:3)
您只是错过了设置对象的正确格式。您不能拥有两个analyzer
或filter
个键,因为此设置地图对象中每个键只能有一个值。提供过滤器列表似乎工作得很好。在创建索引对象时,第二个键覆盖了第一个键。
看这里:
"settings": {
"number_of_shards": 1,
"analysis": {
"filter": {
"double_metaphone_filter": {
"type": "phonetic",
"encoder": "double_metaphone"
},
"ngram": {
"type": "ngram",
"min_gram": 2,
"max_gram": 15
}
},
"analyzer": {
"autocomplete_analyzer": {
"type": "custom",
"tokenizer": "standard",
"filter": ["standard", "lowercase", "ngram"]
},
"phonetic_analyzer": {
"tokenizer": "standard",
"filter": "double_metaphone_filter"
}
}
}
}
我下载了插件以确认这是有效的。
您现在可以使用有效负载在_analyze
点进行测试:
{
"analyzer":"autocomplete_analyzer",
"text":"Jonnie Smythe"
}