我最近开始使用Django并且还没有停止享受python / Django,但我目前正在努力解决逻辑问题。
情况(简化):
class A(models.Model):
foo = models.CharField(max_length=255)
class B(models.Model):
bar = models.CharField(max_length=255)
foo = models.ForeignKey(A)
class C(models.Model):
title = models.CharField(max_length=255)
bar = models.ForeignKey(B)
class D(models.Model):
name = models.CharField(max_length=255)
title = models.ForeignKey(C)
bar = models.ForeignKey(B)
(真实的用例包含数百个这样的类,是的,它是一个烂摊子,它清楚地证明了一个糟糕的数据库设计,但我无法改变这一点)
我在每个班级都创建了动态模型表格。一般目的是检索excel文件并将其插入到字段验证中的正确ModelForms等。每个excel文件都有多个工作表映射到类,第一行(标题)描述modelfields,所有其他行表示数据。 / p>
数据完全未排序,因此通常插入顺序而不破坏外键序列将是A => B => C => D.但是在这种情况下,整个序列可以像D => B => C =>答:当我验证第一张没有验证的表D时,问题就出现了,因为相关的外键还没有定义。
问题是,如何在之后添加所有数据并验证参照完整性?
提前致谢!
感谢您的帮助!
实际上,所有主键都是从根模型派生的,根模型包含所有子表的映射表。我没有在第一篇文章中提到它,因为我想让情况变得简单。话虽如此,我无法改变(混乱!),也不能重新设计类,因为它们映射到任何现有的(凌乱!)数据库。为了完成这个混乱,每个字段都设置为"而不是Null"。
我的第二个想法是最初填写一个映射表(不知道如何做到这一点),并按此排序传入的数据。听起来像猴子的工作,它很脏,我自己也不喜欢这个想法,我希望有更聪明的方法。
你对这个问题的任何数学解决方案有任何暗示吗?它就像跨任意数据的树一样。
更新:
我做了两个功能来解决这个问题,但尚未测试错误处理。
validate_tables:查找与给定应用程序相关的所有表,并在dict中保存嵌套列表(self.found_fields)(子项:[parent,parent,(...)])。
gen_sequence:写入一个列表(self.sequence),并将正确的序列映射到object_names。
欢迎批准!
这是我目前的解决方案(获取想法的片段)
def validate_tables(self):
app = get_app("testdata")
self.sequence = []
self.found_fields = {}
for model in get_models(app):
hits = []
for local_field in model._meta.local_fields:
if isinstance(local_field, models.ForeignKey):
hits.append(local_field.related.parent_model._meta.object_name)
self.found_fields.update({model._meta.object_name: hits})
if self.gen_sequence():
return True
else:
raise self.sequence_errors
def gen_sequence(self, unresolved=None):
if unresolved:
self.found_fields = unresolved
unresolved = {}
else:
unresolved = {}
for model in self.found_fields:
if ((all(parent in self.sequence for parent in self.found_fields[model])
and self.sequence)
or not self.found_fields[model]):
self.sequence.append(model)
else:
unresolved.update({model: self.found_fields[model]})
if unresolved == self.found_fields:
self.sequence_errors = unresolved
return False
elif not unresolved:
return self.gen_sequence
else:
return self.gen_sequence(unresolved)
答案 0 :(得分:0)
您需要定义自己的主键,我认为您有一个合适的字段,否则不会出现此问题,并允许ForeignKey为null。困难的部分是稍后在Django中建立引用完整性which is difficult but seemingly not impossible to do。
相反,我会有两个字段,一个是您的虚拟主键,并使您当前的外键可以为空:
class A(models.Model):
foo = models.CharField(max_length=255)
class B(models.Model):
bar = models.CharField(max_length=255)
foo = models.ForeignKey(A, null=True)
foo_key = models.CharField()
然后,在导入数据后,使用foo_key查找所有'B'对象,建立关系并将foo_key设置为null。
这是我将大量数据从以前的GAE项目导入PostgreSQL数据库时使用的机制。