我正在使用弹性搜索,而且我有一段时间可以完全匹配。我已经尝试过match,query_string等的各种组合,我得到的结果都不算什么。 查询如下所示:
{
"filter": {
"term": {
"term": "dog",
"type": "main"
}
},
"query": {
"match_phrase": {
"term": "Dog"
}
},
"sort": [
"_score"
]
}
排序结果
10.102211 {u'term': u'The Dog', u'type': u'main', u'conceptid': 7730506}
10.102211 {u'term': u'That Dog', u'type': u'main', u'conceptid': 4345664}
10.102211 {u'term': u'Dog', u'type': u'main', u'conceptid': 144}
7.147442 {u'term': u'Dog Eat Dog (song)', u'type': u'main', u'conceptid': u'5288184'}
我看,当然,“狗”,“那只狗”和“狗”都有相同的分数,但我需要弄清楚如何在分数中提升完全匹配“狗”。
我也试过
{
"sort": [
"_score"
],
"query": {
"bool": {
"must": [
{
"match": {
"term": "Dog"
}
},
{
"match_phrase": {
"term": {
"query": "Dog",
"boost": 5
}
}
}
]
}
},
"filter": {
"term": {
"term": "dog",
"type": "main"
}
}
}
但这仍然只是给了我
11.887239 {u'term': u'The Dog', u'type': u'main', u'conceptid': 7730506}
11.887239 {u'term': u'That Dog', u'type': u'main', u'conceptid': 4345664}
11.887239 {u'term': u'Dog', u'type': u'main', u'conceptid': 144}
8.410372 {u'term': u'Dog Eat Dog (song)', u'type': u'main', u'conceptid': u'5288184'}
答案 0 :(得分:14)
默认情况下,使用标准分析器分析字段。如果您想检查完全匹配,您可以存储未分析的字段,例如:
"dog":{
"type":"multi_field",
"fields":{
"dog":{
"include_in_all":false,
"type":"string",
"index":"not_analyzed",
"store":"no"
},
"_tokenized":{
"include_in_all":false,
"type":"string",
"index":"analyzed",
"store":"no"
}
}
}
然后你可以查询dog-field以获得完全匹配,dog._tokenized查询已分析的查询(如全文)
答案 1 :(得分:0)
我认为您的问题是正在使用标准分析器分析字段term
(检查您的映射)并过滤the
或that
等停用词。因此,Dog
和The Dog
得分相同。所以也许您可以通过配置自定义分析器来解决您的问题=> documentation page
答案 2 :(得分:0)
哈希值需要搜索到哈希键的两个值,然后搜索它。