Django查询子记录而不会获得重复的行

时间:2016-03-04 21:22:42

标签: python django django-queryset

我试图编写一个Django查询来查找一组包含某些子记录的父记录。问题是,包含两个与搜索匹配的子项的父记录将在结果中包含两次。

如果每个家长有多个匹配的孩子,我该怎样才能得到每个家长?

我在下面提供了一个演示问题的简单示例。 35%是父级,Blog是孩子。当我搜索包含" Hello"的条目的博客时在标题中,我得到了Jimmy博客的两份副本。

以下是我创建的记录和我尝试的查询:

Entry

您可以看到只有一个博客,但断言失败并且数量为2。

以下是完整示例:

    b = Blog(name="Jimmy's Jottings")
    b.save()
    Entry(blog=b, headline='Hello, World!').save()
    Entry(blog=b, headline='Hello Kitty').save()

    blog_count = Blog.objects.filter(entries__headline__contains='Hello').count()
    assert blog_count == 1, blog_count

2 个答案:

答案 0 :(得分:0)

诀窍是使用子查询查找匹配子项的博客ID,然后搜索在该子查询中具有id的所有博客。然后子查询可以有重复项,而不会在主查询中造成重复。

这是固定查询:

# Tested with Django 1.9.2
import sys

import django
from django.apps import apps
from django.apps.config import AppConfig
from django.conf import settings
from django.db import connections, models, DEFAULT_DB_ALIAS
from django.db.models.base import ModelBase

NAME = 'udjango'


def main():
    setup()

    class Blog(models.Model):
        name = models.CharField(max_length=100)
        tagline = models.TextField()

        def __str__(self):              # __unicode__ on Python 2
            return self.name

    class Entry(models.Model):
        blog = models.ForeignKey(Blog, related_name='entries')
        headline = models.CharField(max_length=255)
        body_text = models.TextField()

        def __str__(self):              # __unicode__ on Python 2
            return self.headline

    syncdb(Blog)
    syncdb(Entry)

    b = Blog(name="Jimmy's Jottings")
    b.save()
    Entry(blog=b, headline='Hello, World!').save()
    Entry(blog=b, headline='Hello Kitty').save()

    blog_count = Blog.objects.filter(entries__headline__contains='Hello').count()
    assert blog_count == 1, blog_count

    print('Done.')


def setup():
    DB_FILE = NAME + '.db'
    with open(DB_FILE, 'w'):
        pass  # wipe the database
    settings.configure(
        DEBUG=True,
        DATABASES={
            DEFAULT_DB_ALIAS: {
                'ENGINE': 'django.db.backends.sqlite3',
                'NAME': DB_FILE}},
        LOGGING={'version': 1,
                 'disable_existing_loggers': False,
                 'formatters': {
                    'debug': {
                        'format': '%(asctime)s[%(levelname)s]'
                                  '%(name)s.%(funcName)s(): %(message)s',
                        'datefmt': '%Y-%m-%d %H:%M:%S'}},
                 'handlers': {
                    'console': {
                        'level': 'DEBUG',
                        'class': 'logging.StreamHandler',
                        'formatter': 'debug'}},
                 'root': {
                    'handlers': ['console'],
                    'level': 'WARN'},
                 'loggers': {
                    "django.db": {"level": "WARN"}}})
    app_config = AppConfig(NAME, sys.modules['__main__'])
    apps.populate([app_config])
    django.setup()
    original_new_func = ModelBase.__new__

    @staticmethod
    def patched_new(cls, name, bases, attrs):
        if 'Meta' not in attrs:
            class Meta:
                app_label = NAME
            attrs['Meta'] = Meta
        return original_new_func(cls, name, bases, attrs)
    ModelBase.__new__ = patched_new


def syncdb(model):
    """ Standard syncdb expects models to be in reliable locations.

    Based on https://github.com/django/django/blob/1.9.3
    /django/core/management/commands/migrate.py#L285
    """
    connection = connections[DEFAULT_DB_ALIAS]
    with connection.schema_editor() as editor:
        editor.create_model(model)

main()

这是生成的SQL查询:

blog_ids = Entry.objects.filter(headline__contains='Hello').values('blog_id')
blog_count = Blog.objects.filter(id__in=blog_ids).count()
assert blog_count == 1, blog_count

答案 1 :(得分:0)

虽然我相信Don Kirby的回应有效,但我认为更好的解决方案是在查询集的末尾添加.distinct()。这简单地消除了查询结果中的任何重复行。 SQL等价物是在给定查询上使用SELECT DISTINCT。