Question

我有一个与某些Resource对象有M2M关系的Story模型。某些Resource对象缺少名称，因此我想将Story的标题复制到指定的Resource对象。

这是我的代码：

from collector import models
from django.core.paginator import Paginator

paginator = Paginator(models.Story.objects.all(), 1000)

def fix_issues():
    for page in range(1, paginator.num_pages + 1):
        for story in paginator.page(page).object_list:
            name_story = story.title
            for r in story.resources.select_subclasses():
                if r.name != name_story:
                    r.name = name_story
                    r.save()
                    if len(r.name) == 0:
                        print("Something went wrong: " + name_story)
        print("done processing page %s out of %s" % (page, paginator.num_pages))

fix_issues()

我需要使用分页器，因为我处理的是一百万个对象。奇怪的是，在调用了fix_issues（）之后，大约有一半没有名字的资源，现在有了正确的名字，而另一半仍然没有名字。我可以反复调用fix_issues（），每次更多对象都会收到一个名字。这对我来说似乎很奇怪，为什么一个对象不会在第一次更新而只是第二次更新？

其他信息：

＆＃34;出了点问题：＆＃34;消息从不打印。
我使用django-model-utils中的select_subclasses来迭代所有资源（任何类型）。
story.title 从不为空。
当我运行这些命令时，不会打印任何错误消息。
我没有覆盖资源模型的save方法（只有Story模型的save方法）。
我尝试使用@ transaction.atomic但结果是一样的。

我的模特：

class Resource(models.Model):
    name = models.CharField(max_length=200)
    # Important for retrieving the correct subtype.
    objects = InheritanceManager()

    def __str__(self):
        return str(self.name)


class CustomResource(Resource):
    homepage = models.CharField(max_length=3000, default="", blank=True, null=True)


class Story(models.Model):
    url = models.URLField(max_length=3000)
    resources = models.ManyToManyField(Resource)
    popularity = models.FloatField()

    def _update_popularity(self):
        self.popularity = 3

    def save(self, *args, **kwargs):
        super(Story, self).save(*args, **kwargs)
        self._update_popularity()
        super(Story, self).save(*args, **kwargs)

select_subclasses的

文档： http://django-model-utils.readthedocs.io/en/latest/managers.html#inheritancemanager

进一步调查： 我想也许select_subclasses没有返回所有对象。现在每个故事都只有一个资源。所以很容易检查select_subclasses总是返回一个项目。这是我使用的功能：

def find_issues():
    for page in range(1, paginator.num_pages + 1):
        for story in paginator.page(page).object_list:
            assert(len(story.resources.select_subclasses()) == 1)
        print("done processing page %s out of %s" % (page, paginator.num_pages))

但同样，这没有任何问题。所以我不应该责备select_subclasses。我还检查了paginator.num_pages是否正确，它是。如果我除以1000（每页项目数），我会得到我在数据库中的故事数量。

Answer 1

我想我知道发生了什么：

Paginator加载一个Queryset并给我前n个项目。我处理这些并更新一些值。但是对于下一次迭代，查询集中项目的顺序会发生变化（因为我更新了其中的一些项目而没有定义订单）。所以我正在跳过第一页上的项目。我可以通过指定订单（例如pk）来避免它。

如果您认为我错了，请告诉我。否则我会接受这个作为正确的答案。谢谢。

Django保存随机行为

1 个答案: