我想知道如何在序列化时减少对数据库的调用次数:
我有以下两种型号:
class House(models.Model):
name = models.CharField(max_length = 100, null = True, blank = True)
address = models.CharField(max_length = 500, null = True, blank = True)
class Room(models.Model):
house = models.ForeignKey(House)
name = models.CharField(max_length = 100)
有1个房子,可以有多个房间。
我正在使用django-rest-framework并尝试在家庭级别将所有3个事物序列化。
class HouseSerializer(serializers.ModelSerializer)
rooms = serializers.SerializerMethodField('room_serializer')
def room_serializer(self):
rooms = Room.objects.filter(house_id = self.id) # we are in House serializer, so self is a house
return RoomSerializer(rooms).data
class Meta:
model = House
fields = ('id', 'name', 'address')
所以现在,对于我想要序列化的每个房子,我需要单独调用它的房间。它有效,但这是一个额外的电话。 (想象一下我试图把很多东西包在一起!)
现在,如果我有100个房子,要序列化所有内容,我需要进行100次数据库点击,O(n)时间
我知道如果我可以将所有信息放在一起,我可以减少到2次点击。 O(1)时间
my_houses = Houses.objects.filter(name = "mine")
my_rooms = Rooms.objects.filter(house_id__in = [house.id for house in my_houses])
我的问题是我该怎么做?并让序列化器快乐?
我可以在做完两个电话后以某种方式做一个循环,将一个房间“附加”到一个房子,然后序列化它? (我可以添加这样的属性吗?)如果可以,我如何让我的序列化程序读取它?
请注意,我不需要django-rest-serializer来允许我以这种方式更改Rooms中的属性。这仅适用于GET。
答案 0 :(得分:9)
正如目前所写,使用SerializerMethodField
,您正在进行N + 1次查询。我已经在Stack Overflow上为optimizing the database queries覆盖了几次,一般来说,它与你improve the performance in Django的方式类似。您正在处理一对多关系,可以使用与prefetch_related
的多对多关系相同的方式进行优化。
class HouseSerializer(serializers.ModelSerializer)
rooms = RoomSerializer(read_only=True, source="room_set", many=True)
class Meta:
model = House
fields = ('id', 'name', 'address', )
我所做的更改使用嵌套序列化程序,而不是在SerializerMethodField
内手动生成序列化程序。我将它限制为read_only
,正如您所提到的,只需要GET
个请求,而可写序列化程序在Django REST Framework 2.4中存在问题。
作为Room
的相反关系 - >尚未设置House
关系,它是默认的room_set
。您可以(并且应该)通过在related_name
字段上设置ForeignKey
来覆盖此设置,您需要相应地调整source
。
为了防止N + 1查询问题,您需要覆盖视图上的查询集。对于通用视图,可以在queryset
属性上或get_queryset
方法中执行此操作,例如queyset = House.objects.prefetch_related('room_set')
。这将请求House
对象的所有相关房间,因此您只需要两个请求,而不是N + 1个请求。