如何确定多个外键中SQL插入的顺序?

时间:2013-01-15 19:46:01

标签: python django

我最近开始使用Django并且还没有停止享受python / Django,但我目前正在努力解决逻辑问题。

情况(简化):

class A(models.Model):
    foo = models.CharField(max_length=255)

class B(models.Model):
    bar = models.CharField(max_length=255)
    foo =  models.ForeignKey(A)

class C(models.Model):
    title = models.CharField(max_length=255)
    bar =  models.ForeignKey(B)

class D(models.Model):
    name = models.CharField(max_length=255)
    title =  models.ForeignKey(C)
    bar =  models.ForeignKey(B)

(真实的用例包含数百个这样的类,是的,它是一个烂摊子,它清楚地证明了一个糟糕的数据库设计,但我无法改变这一点)

我在每个班级都创建了动态模型表格。一般目的是检索excel文件并将其插入到字段验证中的正确ModelForms等。每个excel文件都有多个工作表映射到类,第一行(标题)描述modelfields,所有其他行表示数据。 / p>

数据完全未排序,因此通常插入顺序而不破坏外键序列将是A => B => C => D.但是在这种情况下,整个序列可以像D => B => C =>答:当我验证第一张没有验证的表D时,问题就出现了,因为相关的外键还没有定义。

问题是,如何在之后添加所有数据并验证参照完整性?

提前致谢!


感谢您的帮助!

实际上,所有主键都是从根模型派生的,根模型包含所有子表的映射表。我没有在第一篇文章中提到它,因为我想让情况变得简单。话虽如此,我无法改变(混乱!),也不能重新设计类,因为它们映射到任何现有的(凌乱!)数据库。为了完成这个混乱,每个字段都设置为"而不是Null"。

我的第二个想法是最初填写一个映射表(不知道如何做到这一点),并按此排序传入的数据。听起来像猴子的工作,它很脏,我自己也不喜欢这个想法,我希望有更聪明的方法。

你对这个问题的任何数学解决方案有任何暗示吗?它就像跨任意数据的树一样。

更新:

我做了两个功能来解决这个问题,但尚未测试错误处理。

validate_tables:查找与给定应用程序相关的所有表,并在dict中保存嵌套列表(self.found_fields)(子项:[parent,parent,(...)])。

gen_sequence:写入一个列表(self.sequence),并将正确的序列映射到object_names。

欢迎批准!

这是我目前的解决方案(获取想法的片段)

    def validate_tables(self):
        app = get_app("testdata")
        self.sequence = []
        self.found_fields = {}
        for model in get_models(app):
            hits = []
            for local_field in model._meta.local_fields:
                if isinstance(local_field, models.ForeignKey):
                    hits.append(local_field.related.parent_model._meta.object_name)
            self.found_fields.update({model._meta.object_name: hits})
        if self.gen_sequence():
            return True
        else:
            raise self.sequence_errors


    def gen_sequence(self, unresolved=None):

        if unresolved:
            self.found_fields = unresolved
            unresolved = {}
        else:
            unresolved = {}

        for model in self.found_fields:
            if ((all(parent in self.sequence for parent in self.found_fields[model]) 
                 and self.sequence)
                or not self.found_fields[model]):
                self.sequence.append(model)
            else:
                unresolved.update({model: self.found_fields[model]})

        if unresolved == self.found_fields:
            self.sequence_errors = unresolved
            return False
        elif not unresolved:
            return self.gen_sequence
        else:
            return self.gen_sequence(unresolved)

1 个答案:

答案 0 :(得分:0)

您需要定义自己的主键,我认为您有一个合适的字段,否则不会出现此问题,并允许ForeignKey为null。困难的部分是稍后在Django中建立引用完整性which is difficult but seemingly not impossible to do

相反,我会有两个字段,一个是您的虚拟主键,并使您当前的外键可以为空:

class A(models.Model):
    foo = models.CharField(max_length=255)

class B(models.Model):
    bar = models.CharField(max_length=255)
    foo =  models.ForeignKey(A, null=True)
    foo_key =  models.CharField()

然后,在导入数据后,使用foo_key查找所有'B'对象,建立关系并将foo_key设置为null。

这是我将大量数据从以前的GAE项目导入PostgreSQL数据库时使用的机制。