Django queryset exclude()具有多个相关的字段子句

时间:2013-05-23 02:12:03

标签: django django-orm

我正在Django中创建稀疏首选项表。我的模型很简单:

class Preference(models.Model):
    user = models.ForeignKey(settings.AUTH_USER_MODEL, related_name='preferences')
    preference = models.CharField(max_length=255, db_index=True)
    value = models.BooleanField()

某些首选项具有默认状态,因此我需要能够向数据库询问两个问题:“哪些用户将此首选项设置为某个值?”和“哪些用户没有将此首选项设置为该值(因为他们没有设置首选项,或者因为他们主动将首选项设置为另一个值)?”

我的问题是前一个问题有效,但后一个问题(相同的查询条款,但使用exclude()而不是filter())不起作用。例如:

我的测试数据库有14个用户,一个用户设置了两个偏好设置:'PREF_A'设置为True'PREF_B'设置为False

>>> User.objects.all().count()
14
>>> User.objects.filter(preferences__preference="PREF_A", preferences__value=True).count()
1
>>> User.objects.exclude(preferences__preference="PREF_A", preferences__value=True).count()
13
>>> User.objects.filter(preferences__preference="PREF_A", preferences__value=False).count()
0
>>> User.objects.exclude(preferences__preference="PREF_A", preferences__value=False).count()
13

所以,我的结果说:

共有14个用户

  • 1个用户将PREF_A设置为True

  • 13个用户没有将PREF_A设置为True

  • 0个用户将PREF_A设置为False

  • 13个用户没有将PREF_A设置为False < ---这是不准确的

此查询出错的地方,以及如何编写查询以正确排除特定首选项设置为特定值的人?

我尝试使用Q~Q来查看行为是否会有所不同,但结果是一样的。

3 个答案:

答案 0 :(得分:15)

这是Django中仍然存在的问题exclude()并不是filter的反面。这是the documentation explaining the difference

  

注意

     

filter()对跨越多值的查询的行为   如上所述,关系不是等效地实现的   exclude()。相反,单个exclude()调用中的条件不会   必须指同一个项目。

     

例如,以下查询将排除包含两者的博客   标题为“Lennon”的条目和2008年发布的条目:

Blog.objects.exclude(
    entry__headline__contains='Lennon',
    entry__pub_date__year=2008,
)
     

但是,与使用filter()时的行为不同,这不会受到限制   基于满足两个条件的条目的博客。为了做到   即,选择所有不包含已发布条目的博客   随着2008年出版的“列侬”,你需要制作两部   查询:

Blog.objects.exclude(
    entry__in=Entry.objects.filter(
        headline__contains='Lennon',
        pub_date__year=2008,
    ),
)

你所做的可能是要走的路。

答案 1 :(得分:5)

我实施了一个快速而肮脏的解决方案,所以我可以继续前进,期望它非常低效;但是,在检查生成的SQL时,结果并没有那么糟糕:

>>> User.objects.exclude(id__in=User.objects.filter(preferences__preference="PREF_A", preferences__value=True))

我认为ORM会在完成之前将下级查询的结果加载到网络服务器的内存中(这是一个问题,因为我们的生产应用程序将拥有数百万用户),但实际上它正确使用了一个子查询: / p>

>>> User.objects.exclude(id__in=User.objects.filter(preferences__preference="PREF_A", preferences__value=True)).values('id').query.sql_with_params()
(u'SELECT "sgauth_user"."id" FROM "sgauth_user" WHERE NOT ("sgauth_user"."id" IN (SELECT U0."id" FROM "sgauth_user" U0 INNER JOIN "feeds_preference" U1 ON (U0."id" = U1."user_id") WHERE (U1."preference" = %s  AND U1."value" = %s )))', ('PREF_A', True))

我把它作为一个可能的答案,但我仍然感兴趣,如果有一种方法可以使用简单的排除子句,或通过ORM生成查询的方式与简单的连接一起工作,不子查询无论如何。

答案 2 :(得分:1)

您可以使用新的django子查询来避免对服务器进行2次查询:

User.objects.exclude(id__in=SubQuery(User.objects.filter(preferences__preference="PREF_A", preferences__value=True)))