如何使用GenericRelation的倒数

时间:2016-03-22 19:27:29

标签: python sql django generic-foreign-key django-generic-relations

我必须真正误解Django内容类型框架中GenericRelation field的内容。

要创建一个最小的自包含示例,我将使用教程中的民意调查示例应用程序。将通用外键字段添加到Choice模型中,并创建一个新的Thing模型:

class Choice(models.Model):
    ...
    content_type = models.ForeignKey(ContentType)
    object_id = models.PositiveIntegerField()
    thing = GenericForeignKey('content_type', 'object_id')

class Thing(models.Model):
    choices = GenericRelation(Choice, related_query_name='things')

使用干净的数据库,同步表,并创建几个实例:

>>> poll = Poll.objects.create(question='the question', pk=123)
>>> thing = Thing.objects.create(pk=456)
>>> choice = Choice.objects.create(choice_text='the choice', pk=789, poll=poll, thing=thing)
>>> choice.thing.pk
456
>>> thing.choices.get().pk
789

到目前为止一直很好 - 关系在一个实例的两个方向上都有效。但是从查询集中,反向关系非常奇怪:

>>> Choice.objects.values_list('things', flat=1)
[456]
>>> Thing.objects.values_list('choices', flat=1)
[456]

为什么反向关系再次给我thing的id?我期望相当于选择的主键,相当于以下结果:

>>> Thing.objects.values_list('choices__pk', flat=1)
[789]

这些ORM查询生成如下SQL:

>>> print Thing.objects.values_list('choices__pk', flat=1).query
SELECT "polls_choice"."id" FROM "polls_thing" LEFT OUTER JOIN "polls_choice" ON ( "polls_thing"."id" = "polls_choice"."object_id" AND ("polls_choice"."content_type_id" = 10))
>>> print Thing.objects.values_list('choices', flat=1).query
SELECT "polls_choice"."object_id" FROM "polls_thing" LEFT OUTER JOIN "polls_choice" ON ( "polls_thing"."id" = "polls_choice"."object_id" AND ("polls_choice"."content_type_id" = 10))

Django文档通常非常出色,但我无法理解为什么第二个查询或找到该行为的任何文档 - 它似乎完全从错误的表中返回数据?

2 个答案:

答案 0 :(得分:7)

TL; DR 这是Django 1.7中的一个错误,已在Django 1.8中修复。

这种变化直接转变为主人并且没有进入弃用期,这并不太令人惊讶,因为在这里保持向后兼容性确实很困难。更令人惊讶的是,1.8 release notes中没有提及此问题,因为修复程序会更改当前正在运行的代码的行为。

本答案的其余部分描述了我如何使用git bisect run找到提交。它在这里供我自己参考,所以如果我需要再次将一个大项目一分为二,我可以回到这里。

首先我们设置一个django克隆和一个测试项目来重现这个问题。我在这里使用了virtualenvwrapper,但你可以按照自己的意愿进行隔离。

cd /tmp
git clone https://github.com/django/django.git
cd django
git checkout tags/1.7
mkvirtualenv djbisect
export PYTHONPATH=/tmp/django  # get django clone into sys.path
python ./django/bin/django-admin.py startproject djbisect
export PYTHONPATH=$PYTHONPATH:/tmp/django/djbisect  # test project into sys.path
export DJANGO_SETTINGS_MODULE=djbisect.mysettings

创建以下文件:

# /tmp/django/djbisect/djbisect/models.py
from django.db import models
from django.contrib.contenttypes.models import ContentType
from django.contrib.contenttypes.fields import GenericForeignKey, GenericRelation

class GFKmodel(models.Model):
    content_type = models.ForeignKey(ContentType)
    object_id = models.PositiveIntegerField()
    gfk = GenericForeignKey()

class GRmodel(models.Model):
    related_gfk = GenericRelation(GFKmodel)

也是这个:

# /tmp/django/djbisect/djbisect/mysettings.py
from djbisect.settings import *
INSTALLED_APPS += ('djbisect',)

现在我们有一个工作项目,创建test_script.py以与git bisect run一起使用:

#!/usr/bin/env python
import subprocess, os, sys

db_fname = '/tmp/django/djbisect/db.sqlite3'
if os.path.exists(db_fname):
    os.unlink(db_fname)

cmd = 'python /tmp/django/djbisect/manage.py migrate --noinput'
subprocess.check_call(cmd.split())

import django
django.setup()

from django.contrib.contenttypes.models import ContentType
from djbisect.models import GFKmodel, GRmodel

ct = ContentType.objects.get_for_model(GRmodel)
y = GRmodel.objects.create(pk=456)
x = GFKmodel.objects.create(pk=789, content_type=ct, object_id=y.pk)

query1 = GRmodel.objects.values_list('related_gfk', flat=1)
query2 = GRmodel.objects.values_list('related_gfk__pk', flat=1)

print(query1)
print(query2)

print(query1.query)
print(query2.query)

if query1[0] == 789 == query2[0]:
    print('FIXED')
    sys.exit(1)
else:
    print('UNFIXED')
    sys.exit(0)

该脚本必须是可执行的,因此请使用chmod +x test_script.py添加标记。它应该位于Django被克隆到的目录中,即/tmp/django/test_script.py对我来说。这是因为import django应首先获取本地签出的django项目,而不是来自site-packages的任何版本。

git bisect的用户界面旨在找出出现的错误,所以当你试图找出确定的时候,通常的“坏”和“好”的前缀是倒退的错误已修复。这可能看起来有点颠倒,但如果错误存在,测试脚本应该成功退出(返回代码0),如果修复了错误,它应该失败(使用非零返回代码)。这让我绊了几次!

git bisect start --term-new=fixed --term-old=unfixed
git bisect fixed tags/1.8
git bisect unfixed tags/1.7
git bisect run ./test_script.py

因此,此过程将执行自动搜索,最终找到修复错误的提交。这需要一些时间,因为Django 1.7和Django 1.8之间有很多提交。它平分了1362次修订,大约10步,最终输出:

1c5cbf5e5d5b350f4df4aca6431d46c767d3785a is the first fixed commit
commit 1c5cbf5e5d5b350f4df4aca6431d46c767d3785a
Author: Anssi Kääriäinen <akaariai@gmail.com>
Date:   Wed Dec 17 09:47:58 2014 +0200

    Fixed #24002 -- GenericRelation filtering targets related model's pk

    Previously Publisher.objects.filter(book=val) would target
    book.object_id if book is a GenericRelation. This is inconsistent to
    filtering over reverse foreign key relations, where the target is the
    related model's primary key.

这正是查询从错误的SQL(从错误的表中获取数据)发生变化的提交

SELECT "djbisect_gfkmodel"."object_id" FROM "djbisect_grmodel" LEFT OUTER JOIN "djbisect_gfkmodel" ON ( "djbisect_grmodel"."id" = "djbisect_gfkmodel"."object_id" AND ("djbisect_gfkmodel"."content_type_id" = 8) )

进入正确的版本:

SELECT "djbisect_gfkmodel"."id" FROM "djbisect_grmodel" LEFT OUTER JOIN "djbisect_gfkmodel" ON ( "djbisect_grmodel"."id" = "djbisect_gfkmodel"."object_id" AND ("djbisect_gfkmodel"."content_type_id" = 8) )

当然,通过提交哈希,我们可以在github上轻松找到拉取请求和票证。希望有一天也可以帮助其他人 - 由于迁移,将Django分成两半可能很难设置!

答案 1 :(得分:1)

评论 - 答案太迟了 - 大多数已删除

问题#24002的向后不兼容修复的一个不重要的结果是GenericRelatedObjectManager(例如things)停止为查询设置长时间工作,它只能用于过滤器等。< / p>

>>> choice.things.all()
TypeError: unhashable type: 'GenericRelatedObjectManager'
# originally before 1c5cbf5e5:  [<Thing: Thing object>]

在版本1.8.3和master分支中,#24940已于半年后修复。问题并不重要,因为通用名称thing在没有查询(choice.thing)的情况下更容易工作,并且不清楚此用法是否已记录或未记录。

docs:Reverse generic relations

  

设置related_query_name会创建从相关对象返回到此对象的关系。这允许从相关对象进行查询和过滤。

如果可以使用特定的关系名称而不是仅使用泛型,那将会很好。使用文档中的示例:taged_item.bookmarkstaged_item.content_object更具可读性,但实现它并不值得。