我使用elasticsearch shingles为小型搜索应用构建了自动完成功能。当我测试分析仪和令牌时,一切似乎都设置正确。
PUT /autocomplete
{
"settings": {
"index": {
"number_of_shards": 1,
"number_of_replicas": 1
},
"analysis": {
"filter": {
"autocomplete_shingles_filter": {
"type": "shingle",
"min_shingle_size": 2,
"max_shingle_size": 5,
"output_unigrams": false
}
},
"analyzer": {
"autocomplete_shingles_analyzer": {
"type": "custom",
"tokenizer": "standard",
"filter": [
"lowercase",
"autocomplete_shingles_filter"
]
}
}
}
}
}
GET /autocomplete/_analyze?analyzer=autocomplete_shingles_analyzer&text=2010 toyota camry
但是当我去实际创建索引和映射并使用_all字段的匹配查询时,我得到0结果
"mappings": {
"suggestions": {
"_all": {
"enabled": true,
"index_analyzer": "autocomplete_analyzer",
"search_analyzer": "autocomplete_analyzer"
},
"properties": {
"makes": {
"type": "string",
"include_in_all": true
},
"models": {
"type": "string",
"include_in_all": true
},
"years": {
"type": "string",
"include_in_all": true
}
}
}
}
}
以下是数据样本
PUT /autocomplete/suggestions/_bulk
{"index": {"_id":"1"}}
{"years": ["2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017"]}
{"index": {"_id":"2"}}
{"makes": "Acura", "models": ["Legend Integra NSX Vigor TL RL SLX CL MDX RSX TSX RDX ZDX"]}
{"index": {"_id":"3"}}
{"makes": "Alfa Romeo", "models": ["164 Spider"]}
{"index": {"_id":"4"}}
{"makes": "Aston Martin", "models": ["DB9 Vanquish S DB9 Volante V8 Vantage Vantage DBS Rapide V8 Vantage S V12 Vantage Virage"]}
{"index": {"_id":"5"}}
{"makes": "Alfa Romeo", "models": ["164 Spider"]}
为什么当我使用验证分析器API时这会起作用,但是当我实际创建索引,映射和查询时......我得到0结果?我做错了什么?
更新
{
"query": {
"match": {
"_all": {
"query": "2010 acura integra",
"operator": "and"
}
}
}
}
更新2 我相信我弄清楚了,我使用的是运营商:而且 - 这意味着所有字词都必须在所有字段中,这不会起作用。删除操作员,我得到结果。但是,在我的测试中,似乎多匹配查询可能更适合这个因为1)我可以提升字段2)我不需要使用_all字段3)似乎它有更好的选择调整查询以随着时间的推移对其进行微调,我是否在正确的轨道上?
答案 0 :(得分:0)
您是否应该在autocomplete_shingles_analyzer
字段中使用autocomplete_analyzer
而不是_all
?