ElasticSearch - 过滤嵌套对象而不影响"父级"对象

时间:2017-09-14 16:49:52

标签: python elasticsearch kibana elasticsearch-dsl

我有一个博客对象的ElasticSearch映射,其中包含一个用于注释的嵌套字段。这样,用户就可以向上面显示的博客内容添加评论。 comments字段具有已发布的标志,用于确定评论是否可由其他用户查看或仅由主用户查看。

"blogs" :[
{
     "id":1,
     "content":"This is my super cool blog post",
     "createTime":"2017-05-31",
      "comments" : [
            {"published":false, "comment":"You can see this!!","time":"2017-07-11"}
       ]
},
{
     "id":2,
     "content":"Hey Guys!",
     "createTime":"2013-05-30",
     "comments" : [
               {"published":true, "comment":"I like this post!","time":"2016-07-01"},
               {"published":false, "comment":"You should not be able to see this","time":"2017-10-31"}
       ]
},
{
     "id":3,
     "content":"This is a blog without any comments! You can still see me.",
     "createTime":"2017-12-21",
     "comments" : None
},
]

我希望能够过滤注释,以便只为每个博客对象显示True注释。我想展示每个博客,而不仅仅是那些有真正评论的博客。我在网上找到的所有其他解决方案似乎都会影响我的博客对象。有没有办法过滤掉评论对象而不影响所有博客的查询?

因此,上述示例将在查询后返回:

"blogs" :[
{
     "id":1,
     "content":"This is my super cool blog post",
     "createTime":"2017-05-31",
      "comments" : None # OR EMPTY LIST 
},
{
     "id":2,
     "content":"Hey Guys!",
     "createTime":"2013-05-30",
     "comments" : [
               {"published":true, "comment":"I like this post!","time":"2016-07-01"}
       ]
},
{
     "id":3,
     "content":"This is a blog without any comments! You can still see me.",
     "createTime":"2017-12-21",
     "comments" : None
},
]

该示例仍显示没有评论或错误评论的博客。

这可能吗?

我一直在使用此示例中的嵌套查询:ElasticSearch - Get only matching nested objects with All Top level fields in search response

但是这个例子影响了博客本身,并且不会返回只有虚假评论或没有评论的博客。

请帮助:)谢谢!

1 个答案:

答案 0 :(得分:0)

好的,所以发现使用elasticsearch查询显然没有办法做到这一点。但是我想出了一个在django / python方面做到这一点的方法(这就是我需要的)。我不确定是否有人需要这些信息,但如果您需要这些信息并且您正在使用Django / ES / REST,那么我就是这么做的。

我按照elasticsearch-dsl文档(http://elasticsearch-dsl.readthedocs.io/en/latest/)将elasticsearch与我的Django应用程序连接起来。然后我使用rest_framework_elasticsearch包框架来创建视图。

要创建仅查询elasticsearch项列表中的True嵌套属性的Mixin,请创建rest_framework_elastic.es_mixins ListElasticMixin对象的mixin子类。然后在我们的新mixin中覆盖es_representation定义,如下所示。

class MyListElasticMixin(ListElasticMixin):
    @staticmethod
    def es_representation(iterable):

        items = ListElasticMixin.es_representation(iterable)

        for item in items:
            for key in item:
                if key == 'comments' and item[key] is not None:
                    for comment in reversed(item[key]):
                        if not comment['published']:
                            item[key].remove(comment)

        return items

确保在for循环注释中使用reversed函数,否则您将跳过列表中的一些注释。

我在视图中使用这个新过滤器。

class MyViewSet(MyListElasticMixin, viewsets.ViewSet):
   # Your view code here

    def get(self, request, *args, **kwargs):
        return self.list(request, *args, **kwargs)

在python端执行它肯定更容易和有效。