检索mptt查询集的祖先的查询集的高效函数

时间:2011-06-24 17:15:24

标签: python django hierarchical-data django-mptt mptt

有没有人有一个有效的算法来检索一个mptt查询集的所有祖先?到目前为止,我能想到的最好的是这样的:

def qs_ancestors(queryset):
    if isinstance(queryset, EmptyQuerySet):
        return queryset
    queryset_aggs = queryset.values_list('tree_id', 'level').annotate(max_lft=Max('lft'), min_rght=Min('rght'))
    new_queryset = queryset.none()
    for tree_id, level, max_lft, min_rght in queryset_aggs:
        ancestors = MyModel.objects.filter(
           tree_id=tree_id,
           level__lt=level, 
           lft__lte=max_lft,
           rght__gte=min_rght,
        )
        new_queryset = ancestors | new_queryset
    return new_queryset

这种方法存在两个问题:

  1. 如果存在彼此不相邻的分支(即它确实不起作用),则会失败。
  2. 这是非常低效的,因为它最终在最终查询中有number_of_trees*number_of_levels个子句,可以非常快速地显示
  3. 我愿意在其他地方缓存祖先,但我想不出有效的方法。我考虑添加一个带有逗号分隔的祖先id的列表的字段,然后在一个额外的内部执行GROUP_CONCAT(我在MySQL中),但我认为这可能会变得很大/很慢。

2 个答案:

答案 0 :(得分:3)

怎么样:

def qs_ancestors(queryset):
    if isinstance(queryset, EmptyQuerySet):
        return queryset
    new_queryset = queryset.none()
    for obj in queryset:
        new_queryset = new_queryset | obj.get_ancestors()
return new_queryset

它仍然是len(queryset)子句。您可以通过执行预处理传递来删除一些子句的数量,这些传递删除了作为查询集中其他对象的祖先的对象,如:

min_obj_set = []
for obj in queryset.order_by('tree_id', '-level'):
    for obj2 in min_obj_set:
        if obj.is_ancestor_of(obj2):
            break
    else:
        min_obj_set.append(obj)

虽然上面的代码段只是一个示例,但如果您的querset包含大量对象,您可能希望使用BST。

但是,你必须测试这是否会增加速度,而不是更大的数据库查询。

答案 1 :(得分:3)

我必须编写一次类似的算法。我有一个显示MPTT树的视图,它是一个非常大的树,所以我无法在HTML模板中加载它的所有数据。所以我只在初始加载中显示了根节点,并使用Ajax加载其他节点。

直到我的老板要求我实施“搜索”选项,这才有效。搜索必须查看所有节点并在发现匹配时爆炸树。我花了一段时间来弄明白这一点,但我终于明白了。以下是解决方案:

from django.db.models import Q

def get_parents(self, qs):
    tree_list = {}
    query = Q()
    for node in qs:
        if node.tree_id not in tree_list:
            tree_list[node.tree_id] = []

        parent =  node.parent.pk if node.parent is not None else None,

        if parent not in tree_list[node.tree_id]:
            tree_list[node.tree_id].append(parent)

            query |= Q(lft__lt=node.lft, rght__gt=node.rght, tree_id=node.tree_id)

    return YourModel.objects.filter(query)

它只需要运行两个查询,作为参数传递的初始qs和函数返回的最终查询集。 tree_list是一个字典,用于存储已添加到查询集的节点,这是一个优化,并且算法无需工作。但是,由于我正在与一棵相对较大的树一起工作,所以我必须把它包括在内。

我想你可以把这个方法变成一个管理者,让它更通用,即让它适用于任何MPTT模型而不仅仅是YourModel