Django ORM过滤两个相关模型的最大列值

时间:2017-10-12 17:58:32

标签: python django django-queryset django-orm

我有3个相关模型:

Program(Model):
    ...  # which aggregates ProgramVersions

ProgramVersion(Model):
    program = ForeignKey(Program)
    index = IntegerField()

UserProgramVersion(Model):
    user = ForeignKey(User)
    version = ForeignKey(ProgramVersion)
    index = IntegerField()

ProgramVersion和UserProgramVersion是基于index字段的可订购模型 - 表中具有最高index的对象被视为最新/最新对象(这由一些自定义逻辑处理,不相关)。

我想选择所有最新的UserProgramVersion,即指向同一程序的最新 UPV&#39>

这可以通过此UserProgramVersion查询集来处理:

def latest_user_program_versions(self):
    latest = self\
        .order_by('version__program_id', '-version__index', '-index')\
        .distinct('version__program_id')

    return self.filter(id__in=latest)

这工作正常,但我正在寻找一个不使用.distinct()的解决方案 我试过这样的事情:

def latest_user_program_versions(self):
    latest = self\
        .annotate(
             'max_version_index'=Max('version__index'),
             'max_index'=Max('index'))\
        .filter(
             'version__index'=F('max_version_index'),
             'index'=F('max_index'))

    return self.filter(id__in=latest)

然而这不起作用

1 个答案:

答案 0 :(得分:2)

在Django 1.11中使用 Subquery() expressions 。 docs中的示例类似,目的也是获取所需父记录的最新项目。

(你可以用你的对象开始这个例子,但我还写了一个更复杂的建议,以避免可能的性能陷阱。)

from django.db.models import OuterRef, Subquery

...
def latest_user_program_versions(self, *args, **kwargs):
    # You should filter users by args or kwargs here, for performance reasons.
    # If you do it here it is applied also to subquery - much faster on a big db.
    qs = self.filter(*args, **kwargs)
    parent = Program.objects.filter(pk__in=qs.values('version__program'))
    newest = (
        qs.filter(version__program=OuterRef('pk'))
        .order_by('-version__index', '-index')
    )
    pks = (
        parent.annotate(newest_id=Subquery(newest.values('pk')[:1]))
        .values_list('newest_id', flat=True)
    )
    # Maybe you prefer to uncomment this to be it compiled by two shorter SQLs.
    # pks = list(pks)
    return self.filter(pk__in=pks)

如果你大大改进了,请在答案中写下解决方案。

第二个解决方案中的

编辑 您的问题
没有人可以在他下面剪一个分支,在SQL中都没有,但是我可以坐在子查询中的临时副本上,以便能够幸存下来:-)这也是我在开始时要求过滤器的原因。第二个问题是Max(' version__index')和Max(' index')可能来自两个不同的对象,并且找不到有效的交集。

EDIT2 已验证:我的查询中的内部SQL很复杂,但似乎是正确的。

SELECT app_userprogramversion.id,...
FROM app_userprogramversion
WHERE app_userprogramversion.id IN
   (SELECT
       (SELECT U0.id
        FROM app_userprogramversion U0
        INNER JOIN app_programversion U2 ON (U0.version_id = U2.id)
        WHERE (U0.user_id = 123 AND U2.program_id = (V0.id))
        ORDER BY U2.index DESC, U0.index DESC LIMIT 1
        ) AS newest_id
    FROM app_program V0 WHERE V0.id IN
       (SELECT U2.program_id AS Col1
        FROM app_userprogramversion U0
        INNER JOIN app_programversion U2 ON (U0.version_id = U2.id)
        WHERE U0.user_id = 123
        )
    )