我正在尝试使用elasticsearch搜索特定短语,即“foo bar”。我的查询类似于下面的查询:
curl -X GET "http://localhost:9200/objects/object/_search" -d '{
"query": {
"bool": {
"must": [
{
"query_string": {
"query": "\"foo bar\"",
"default_field": "_all"
}
}
]
}
}
}'
我的索引中有两个对象,看起来与此类似:
{
sub_sections: [
{
name: "foo"
},
{
name: "bar"
}
]
}
和
{
sub_sections: [
{
name: "foo bar"
}
]
}
当我在查询中使用双引号时,我期待只返回匹配短语的最后一个对象。但是,始终返回两个对象。到目前为止,我已经尝试过像auto_generate_phrase_queries
++这样的选项,但没有运气。
这是预期的行为吗?我怎么能只返回具有完全短语匹配的文件?
答案 0 :(得分:4)
默认情况下,两个示例都以完全相同的方式编制索引。当索引相同字段的多个实例时,它们被顺序索引,一个字段的最后一个字段与后一个字段的第一个字段之间没有间隙。这就是短语搜索跨越字段实例的原因。您可以通过将mapping中的position_offset_gap
设置为非零值来增加字段之间的差距。有关快速演示,请参阅https://gist.github.com/4420794。