我正在尝试获取属于相关列表对象的特定from_date和to_date范围内的所有Horse对象。例如
Horse.objects.filter(listings__to_date__lt=to_date.datetime,
listings__from_date__gt=from_date.datetime)
现在据我所知,这个数据库查询创建了一个内部联接,然后我可以根据相关的列表日期找到我所有的马对象。
我的问题是这是如何运作的,它可能归结为对内部联接实际工作方式的主要缺乏理解。此查询是否需要首先检查'每个和永远的马对象首先确定它是否有相关的列表对象?我想这可能会被证明是非常低效的,因为你可能有500万马对象没有相关的列表对象,但你仍然需要先检查每一个?
或者我可以从我的列表开始,先做这样的事情:
Listing.objects.filter(to_date__lt=to_date.datetime,
from_date__gt=from_date.datetime)
然后:
for listing in listing_objs:
if listing.horse:
horses.append(horse)
但这似乎也是实现我的结果的一种奇怪方式。
如果有人能帮助我理解查询在Django中是如何工作的,那么最有效的方法就是进行这样的查询,这将是一个很大的帮助!
这是我目前的模型设置:
class Listing(models.Model):
to_date = models.DateTimeField(null=True, blank=True)
from_date = models.DateTimeField(null=True, blank=True)
promoted_to_date = models.DateTimeField(null=True, blank=True)
promoted_from_date = models.DateTimeField(null=True, blank=True)
# Relationships
horse = models.ForeignKey('Horse', related_name='listings', null=True, blank=True)
class Horse(models.Model):
created_date = models.DateTimeField(null=True, blank=True, auto_now=True)
type = models.CharField(max_length=200, null=True, blank=True)
name = models.CharField(max_length=200, null=True, blank=True)
age = models.IntegerField(null=True, blank=True)
colour = models.CharField(max_length=200, null=True, blank=True)
height = models.IntegerField(null=True, blank=True)
答案 0 :(得分:1)
编写查询的方式实际上取决于大多数时候您想要的信息。如果您对马匹感兴趣,请从Horse
查询。如果您对商家信息感兴趣,那么您应该从Listing
进行查询。这通常是正确的做法,特别是当您使用简单的外键时。
关于Django,您的第一个查询可能是更好的查询。我使用稍微简单的模型来说明差异。我创建了一个active
字段,而不是使用日期时间。
In [18]: qs = Horse.objects.filter(listings__active=True)
In [19]: print(qs.query)
SELECT
"scratch_horse"."id",
"scratch_horse"."name"
FROM "scratch_horse"
INNER JOIN "scratch_listing"
ON ( "scratch_horse"."id" = "scratch_listing"."horse_id" )
WHERE "scratch_listing"."active" = True
上面查询中的内部联接将确保您只获得具有列表的马匹。 (大多数)数据库非常擅长使用连接和索引来过滤掉不需要的行。
如果Listing
非常小,且Horse
相当大,那么我希望数据库只查看Listing表,然后使用索引来获取Horse的正确部分而不用做全表扫描(检查每匹马)。您需要运行查询并检查数据库正在执行的操作。 EXPLAIN(或您使用的任何数据库)非常有用。如果您猜测数据库正在做什么,那么您可能错了。
请注意,如果您需要访问每个listings
的{{1}},则每次访问horse
时都会执行另一个查询。如果您需要访问horse.listings
,prefetch_related可以通过执行单个查询并将其存储在缓存中来帮助您。
现在,您的第二个查询:
listings
这会进行LEFT连接,这意味着右侧可以包含NULL。在这种情况下,右侧是In [20]: qs = Listing.objects.filter(active=True).select_related('horse')
In [21]: print(qs.query)
SELECT
"scratch_listing"."id",
"scratch_listing"."active",
"scratch_listing"."horse_id",
"scratch_horse"."id",
"scratch_horse"."name"
FROM "scratch_listing"
LEFT OUTER JOIN "scratch_horse"
ON ( "scratch_listing"."horse_id" = "scratch_horse"."id" )
WHERE "scratch_listing"."active" = True
。如果您有很多没有马的列表,这将表现得非常差,因为它会带回每一个活跃的列表,无论马是否与之相关联。你可以用Horse
解决这个问题。
看到我已使用.filter(active=True, horse__isnull=False)
加入表格,以便您能够访问select_related
而无需进行其他查询。
现在我应该问为什么你的所有字段都可以为空。这通常是一个糟糕的设计选择,特别是对于ForeignKeys。你有没有一匹与马无关的名单?如果没有,请删除null。你会不会有一匹没有名字的马?如果没有,请删除null。
所以答案是,做大多数时候看似自然的事情。如果你知道一个特定的表会很大,那么你必须检查查询计划器(EXPLAIN),看看在过滤器/连接条件上添加/使用索引,或从另一侧查询关系。