Django汇总每天的记录数

时间:2013-05-30 23:40:12

标签: python django orm

我有一个正在进行日志记录的django应用程序。我的模型看起来像这样:

class MessageLog(models.Model):
    logtime = models.DateTimeField(auto_now_add=True)
    user = models.CharField(max_length=50)
    message = models.CharField(max_length=512)

想要做的是获取一周中每天记录的平均邮件数,以便我可以查看哪些日期最活跃。我设法编写了一个查询,它可以提取每天的邮件总数:

for i in range(1, 8):
    MessageLog.objects.filter(logtime__week_day=i).count()

但是我在查询中计算平均值时遇到了麻烦。我现在拥有的是:

for i in range(1, 8):
    MessageLog.objects.filter(logtime__week_day=i).annotate(num_msgs=Count('id')).aggregate(Avg('num_msgs'))

出于某种原因,这是每天返回1.0但是。我查看了它正在生成的SQL,它是:

SELECT AVG(num_msgs) FROM (
SELECT 
`myapp_messagelog`.`id` AS `id`, `myapp_messagelog`.`logtime` AS `logtime`, 
`myapp_messagelog`.`user` AS `user`, `myapp_messagelog`.`message` AS `message`, 
COUNT(`myapp_messagelog`.`id`) AS `num_msgs` 
FROM `myapp_messagelog` 
WHERE DAYOFWEEK(`myapp_messagelog`.`logtime`) = 1 
GROUP BY `myapp_messagelog`.`id` ORDER BY NULL
) subquery

我认为问题可能来自GROUP BY id,但我不太确定。任何人有任何想法或建议吗?提前谢谢!

3 个答案:

答案 0 :(得分:10)

您列出的查询总是给出1的原因是因为您没有按日期分组。基本上,您已经要求数据库采用一周中给定日期的MessageLog行。对于每个这样的行,计算它有多少个ID(总是1)。然后取所有这些计数的平均值,当然也是1。

通常,您需要使用values子句在MessageLogannotate部分之前对aggregate行进行分组。但是,由于您的logtime字段是日期时间而不仅仅是日期,因此我不确定您是否可以直接使用Django的ORM表达。你可以使用extra子句来完成它,如here所示。或者,如果你觉得你可以在你的SQL中声明一个你喜欢的聚合和平均数学的视图,并为它声明一个非托管模型,那么只需正常使用ORM。

因此extra字段用于获取每个实际日期的记录总数,但不处理聚合计算注释的平均值。我认为这可能是从您必须使用原始SQL查询的模型中充分抽象出来的,或者至少我找不到任何使它在一次调用中工作的东西。

也就是说,您已经知道如何在一个简单的查询中获得每个工作日的记录总数,如您的问题所示。

此查询将告诉您给定工作日有多少不同的日期记录:

MessageLog.objects.filter(logtime__week_day=i).dates('logtime', day').count()

所以你可以在Python中进行平均数学运算,这可能比尝试正确使用SQL更简单。

或者,此查询将在一个查询中获取所有工作日的原始消息数,而不是for循环:

MessageLog.objects.extra({'weekday': "dayofweek(logtime)"}).values('weekday').annotate(Count('id'))

但是我无法得到一个很好的查询来为您提供每个工作日注释的不同日期的计数 - 日期查询集失去处理注释调用的能力,并注释extra值似乎也不起作用。

考虑到SQL表达并不难,这一点非常棘手。

答案 1 :(得分:3)

我使用datetime字段执行类似操作,但注释额外值对我有用。我有一个记录模型,其中包含日期时间字段“created_at”和“my_value”字段,我希望得到它的平均值。

from django.db.models import Avg

qs = Record.objects.extra({'created_day':"date(created_at)"}).\
    values('created_day').\
    annotate(count=Avg('my_value)

以上内容将按“created_at”字段中日期时间值的日期进行分组。

答案 2 :(得分:0)

queryset.extra(select={'day': 'date(logtime)'}).values('day').order_by('-day').annotate(Count('id'))