我的弹性搜索数据库中有这样的文档:
{
"tags" => [
"tag-1",
"tag-2",
"tag-3",
"tag-A"
]
"created_at" =>"2013-07-02 12:42:19 UTC",
"label" =>"Mon super label"
}
我希望能够使用以下条件过滤我的文档: 文档标签数组必须包含标签-1,标签-3和标签-2,但不得包含标签-A。
我尝试使用bool过滤器,但我无法使其工作!
答案 0 :(得分:15)
这是一个似乎可以实现的方法:http://sense.qbox.io/gist/4dd806936f12a9668d61ce63f39cb2c284512443
首先,我创建了一个带有显式映射的索引。我这样做了,所以我可以将"tags"
属性设置为"index": "not_analyzed"
。这意味着不会以任何方式修改文本,这将简化此示例的查询过程。
curl -XPUT "http://localhost:9200/test_index" -d'
{
"mappings": {
"docs" : {
"properties": {
"tags" : {
"type": "string",
"index": "not_analyzed"
},
"label" : {
"type": "string"
}
}
}
}
}'
然后添加一些文档:
curl -XPUT "http://localhost:9200/test_index/docs/1" -d'
{
"tags" : [
"tag-1",
"tag-2",
"tag-3",
"tag-A"
],
"label" : "item 1"
}'
curl -XPUT "http://localhost:9200/test_index/docs/2" -d'
{
"tags" : [
"tag-1",
"tag-2",
"tag-3"
],
"label" : "item 2"
}'
curl -XPUT "http://localhost:9200/test_index/docs/3" -d'
{
"tags" : [
"tag-1",
"tag-2"
],
"label" : "item 3"
}'
然后我们可以使用must
过滤器中的must_not
和bool
子句进行查询,如下所示:
curl -XPOST "http://localhost:9200/test_index/_search" -d'
{
"query": {
"filtered": {
"query": {
"match_all": {}
},
"filter": {
"bool": {
"must": [
{
"terms": {
"tags": [
"tag-1",
"tag-2",
"tag-3"
],
"execution" : "and"
}
}
],
"must_not": [
{
"term": {
"tags": "tag-A"
}
}
]
}
}
}
}
}'
产生正确的结果:
{
"took": 3,
"timed_out": false,
"_shards": {
"total": 2,
"successful": 2,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1,
"hits": [
{
"_index": "test_index",
"_type": "docs",
"_id": "2",
"_score": 1,
"_source": {
"tags": [
"tag-1",
"tag-2",
"tag-3"
],
"label": "item 2"
}
}
]
}
}
请注意"execution" : "and"
子句中terms
过滤器中的must
参数。这意味着只返回指定了所有"tags"
的文档(而不是那些匹配一个或多个的文档)。那可能是你错过的。您可以在ES docs中了解有关这些选项的更多信息。
我制作了一个可以运行的可运行示例here,如果您已在localhost:9200
安装并运行ES,或者您可以提供自己的终端。