复杂GROUP BY与Django的ORM

时间:2016-01-12 16:12:33

标签: sql django postgresql django-models django-orm

我有一个跟踪电力消耗的Django应用程序,我很难想出一种方法来使用Django的ORM来获取一些信息。

我的具体用例是:我有一组电力消耗读数,每个都有日期时间字段,消耗和成本(以及其他几个,但这些是相关的)。我需要将按月,年,电表和电价分组的消费和成本值相加。换句话说,我需要能够获得每个月每个月的总能耗值和相应的成本(如果你仔细查看帖子后面的表格,则更容易理解)。

这是我的ElectricityReading模型及其父Reading模型(因为我们还有水和天然气的消耗读数,它们也来自Reading分开):

from model_utils.models import TimeStampedModel
# Other imports here...

class Reading(TimeStampedModel):
    meter = models.ForeignKey(Meter)
    datetime = models.DateTimeField() # Terrible property name, I know :)

    class Meta:
        abstract = True

class ElectricityReading(Reading):
    price = models.ForeignKey(ElectricityPrice)
    consumption = models.DecimalField(max_digits=18, decimal_places=3,
                                  null=True, blank=True, default=None)
    cost = models.DecimalField(max_digits=18, decimal_places=3, null=True,
                           blank=True, default=None)

现在我用这个原始SQL做这个,我根据一些参数构建它:

SELECT
    (EXTRACT(YEAR FROM datetime)) AS reading_date_year,
    (EXTRACT(MONTH FROM datetime)) AS reading_date_month,
    SUM(consumption) as total_consumption,
    SUM(cost) as total_cost,
    COUNT(id) as num_readings,
    price_id
FROM electricity_reading
WHERE meter_id IN (10)
    AND datetime >= '2015-10-01 00:00'
    AND datetime <= '2015-12-31 23:59'
GROUP BY reading_date_year, reading_date_month, price_id, meter_id
ORDER BY meter_id, reading_date_year, reading_date_month, price_id

此SQL查询会产生类似以下数据的内容(组成值和简化列名以便更好地格式化):

╔══════╦═══════╦═════════════╦══════╦══════════════╦═══════╗
║ year ║ month ║ consumption ║ cost ║ num_readings ║ price ║
╠══════╬═══════╬═════════════╬══════╬══════════════╬═══════╣
║ 2015 ║    10 ║         600 ║  804 ║          456 ║     1 ║
║ 2015 ║    10 ║         728 ║  471 ║         1998 ║     2 ║
║ 2015 ║    10 ║         848 ║  792 ║         1266 ║     3 ║
║ 2015 ║    10 ║         256 ║  705 ║          744 ║     5 ║
║ 2015 ║    11 ║         528 ║  377 ║          630 ║     1 ║
║ 2015 ║    11 ║         016 ║  687 ║         1680 ║     2 ║
║ 2015 ║    11 ║         240 ║  826 ║         1289 ║     3 ║
║ 2015 ║    11 ║         736 ║  522 ║          720 ║     5 ║
║ 2015 ║    12 ║         584 ║  627 ║          608 ║     1 ║
║ 2015 ║    12 ║         776 ║  078 ║         1627 ║     2 ║
║ 2015 ║    12 ║         600 ║  401 ║         1410 ║     3 ║
║ 2015 ║    12 ║         864 ║  842 ║          744 ║     5 ║
╚══════╩═══════╩═════════════╩══════╩══════════════╩═══════╝

使用Django的ORM,我认为我需要的代码与以下内容类似:

objs = ElectricityReading.objects\
    .filter(
        meter=10,
        datetime__gte='2015-05-01 00:00',
        datetime__lte='2015-08-31 23:59'
    ).only('price_id')\
    .annotate(reading_date_year=YearTransform('datetime'))\
    .annotate(reading_date_month=MonthTransform('datetime'))\
    .annotate(total_consumption=Sum('consumption'))\
    .annotate(total_cost=Sum('cost'))\
    .annotate(num_readings=Count('id'))\
    .order_by('meter_id', 'reading_date_year', 'reading_date_month', 'price_id')

但它生成的SQL不是我需要的:

SELECT
    id,
    price_id,
    EXTRACT('year' FROM datetime AT TIME ZONE 'Europe/Lisbon') AS reading_date_year,
    EXTRACT('month' FROM datetime AT TIME ZONE 'Europe/Lisbon') AS reading_date_month,
    SUM(consumption) AS total_consumption, SUM(cost) AS total_cost,
    COUNT(id) AS num_readings
FROM geratriz_electricityreading
WHERE (
    datetime >= '2015-05-01 00:00:00+01:00'
    AND datetime <= '2015-08-31 23:59:00+01:00'
    AND meter_id = 10)
GROUP BY
    id,
    EXTRACT('year' FROM datetime AT TIME ZONE 'Europe/Lisbon'),
    EXTRACT('month' FROM datetime AT TIME ZONE 'Europe/Lisbon')
ORDER BY meter_id ASC, reading_date_year ASC, reading_date_month ASC, price_id ASC

这会导致从数据库返回更多行,因为没有按照我的需要进行分组。

我无法用Django的ORM复制的SQL查询部分是最后的GROUP BY子句。 Django坚持按ID进行分组,我似乎无法通过meter_id和price_id找到一种方法进行分组。

鉴于我已经花了多少时间在这上面,我倾向于说我想要完成的事情根本不可能与Django的ORM相关但我希望有人会告诉我我,我错过了一些东西。

1 个答案:

答案 0 :(得分:2)

尝试使用values()

price_id

这应该将结果分组到meter=10。如果您一次显示多个米而不是values('price_id', 'meter'),那么您可以执行let startedAt:NSDate = NSDate() self.callOutToCPlusPlus(loads:of, passedIn:values) print("CPlusPlus done in \(NSDate().timeIntervalSinceDate(startedAt)) seconds") 并在两个字段中进行分组。