如何通过计算属性的总和对Django模型进行排序?

时间:2018-05-05 13:45:03

标签: django database django-orm

我有两个模型,Project和Session。一个项目有很多会话,一个用户有很多项目:

class Project(models.Model):
    class Meta:
        ordering = [models.functions.Lower("name")]

    name = models.CharField(max_length=255)
    user = models.ForeignKey(User, on_delete=models.CASCADE)

class Session(models.Model):
    start = models.DateTimeField()
    end = models.DateTimeField()
    timezone = TimeZoneField()
    breaks = models.IntegerField(default=0, validators=[MinValueValidator(0)])
    project = models.ForeignKey(Project, on_delete=models.CASCADE)

    def duration(self):
        # returns minutes in (end - start)

我想要一种方法来获取给定用户的所有项目,并按其所有会话中的持续时间总和进行排序。由于session.duration()不是数据库字段,而是根据数据库字段计算,因此我无法在单个数据库查询中获取此信息。

我目前的解决方案是:

sessions = Session.objects.filter(project__user=self)
groups = [[a, sum([s.duration() for s in b])] for a, b in groupby(
 sessions, key=lambda s: s.project
)]
groups = sorted(groups, key=lambda g: g[1], reverse=True)
return [g[0] for g in groups]

这会在单个查询中获取所有相关会话,但之后我按项目对它们进行分组,这需要太长时间 - 大约有100个项目时大约需要一秒钟。有没有办法实现这个需要更少的时间?理想情况下,每个项目都不需要数据库调用吗?

我正在使用Django 2.0。

1 个答案:

答案 0 :(得分:1)

您可以使用注释和聚合来实现此目的。首先,通过更改以下行来稍微修改会话模型:

project = models.ForeignKey(Project, on_delete=models.CASCADE)

到此:

project = models.ForeignKey(Project, related_name='sessions', on_delete=models.CASCADE)

- 现在每个Project实例都会有一个sessions字段,其中包含与Session相关的所有Project的查询集。

您可以使用所有用户的项目并循环浏览每个项目的会话,而不是像现在这样执行所有用户会话,而不是:

projects = Project.objects.filter(user=self)
for p in projects:
    sessions = p.sessions.all()

然后你可以操作sessions查询集,用表达式字段注释它们:

from django.db.models import ExpressionWrapper, F, fields

duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
sessions = p.sessions.annotate(d=duration_)

此时sessions查询集的每个成员都会有一个名为d的字段,其中包含相应的Session的持续时间。 为了总结持续时间,我们可以使用Django查询集的聚合功能,如下所示:

from django.db.models import Sum
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]

我们在第二行上做的是从查询集创建单个元素(“聚合”它),添加d字段中的所有值,然后分配结果到一个名为total_duration的字段。这个表达式的结果是:

sessions.aggregate(total_duration=Sum('d'))

是只有一个密钥(dict)的total_duration,我们可以从中获取该值。

接下来,您可以构建项目和持续时间列表,然后按持续时间对其进行排序,例如:像这样:

import operator
plist = []
for p in projects:
    sessions = p.sessions.annotate(d=duration_)
    total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
    # total holds the sum of this project's sessions
    plist.append({'p':p,'total':total})
plist.sort(key=operator.itemgetter('total'))

projects = [item['p'] for item in plist]

总结一下:

import operator
from django.db.models import F, Sum, ExpressionWrapper, fields

duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
projects = Project.objects.filter(user=self)
plist = []

for p in projects:
    sessions = p.sessions.annotate(d=duration_)
    total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
    # total holds the sum of this project's sessions
    plist.append({'p':p,'total':total})

plist.sort(key=operator.itemgetter('total'))

projects = [item['p'] for item in plist]

参考:this answerDjango Query ExpressionsDjango Aggregation