我想编写一个新的迁移文件,将旧的坏数据改成更好的数据。比如老款是这样的:
from django.db import models
class Person(models.Model):
fullname = models.CharField(max_length=250, null=True)
information = models.CharField(max_length=350, null=True)
并且 fullname 的值是这样的:
first_name:George;last_name:Adam Pince Green
which first_name 和 last_name 始终处于相同的顺序。 信息的价值是这样的:
id_code:0021678913;born_in:Canada;birth_year:1975
或
birth_year:1990;born_in:Portugal;id_code:0219206431
未订购。 现在我需要编写一个迁移文件,将这个全名和信息值拆分为新模型,例如:
from django.db import models
class Person(models.Model):
first_name = models.CharField(max_length=30, null=True)
last_name = models.CharField(max_length=50, null=True)
id_code = models.CharField(max_length=10, null=True)
born_in = models.CharField(max_length=30, null=True)
birth_year = models.PositiveSmallIntegerField(null=True)
答案 0 :(得分:0)
您可以更改新字段,然后使用 django.db.migrations.operations.RunPython
从旧字段中提取值并保存到新字段中。最后删除旧字段。 https://docs.djangoproject.com/en/3.1/ref/migration-operations/#django.db.migrations.operations.RunPython
答案 1 :(得分:0)
对于您的代码,您可以编写如下内容:
from django.db import migrations, models
def ammend_the_data(apps, _):
Person = apps.get_model('people', 'Person')
people = Person.objects.all().iterator()
for person in people:
fullnamesplit = person.fullname.split(';')
first_name = fullnamesplit[0].split(':')[1]
last_name = fullnamesplit[1].split(':')[1]
informationsplit = person.information.split(';')
info2 = {}
for info in informationsplit:
info3 = info.split(':')
info2.update({info3[0] : info3[1]})
person.first_name = first_name
person.last_name = last_name
person.id_code = info2.get('id_code')
person.born_in = info2.get('born_in')
person.birth_year = int(info2.get('birth_year'))
person.save()
class Migration(migrations.Migration):
initial = True
dependencies = [
]
operations = [
migrations.CreateModel(
name='Person',
fields=[
('id', models.AutoField(auto_created=True, primary_key=True, serialize=False, verbose_name='ID')),
('fullname', models.CharField(max_length=250, null=True)),
('information', models.CharField(max_length=350, null=True)),
('first_name', models.CharField(max_length=30, null=True)),
('last_name', models.CharField(max_length=50, null=True)),
('id_code', models.CharField(max_length=10, null=True)),
('born_in', models.CharField(max_length=30, null=True)),
('birth_year', models.PositiveSmallIntegerField(null=True)),
],
),
migrations.RunPython(
code= ammend_the_data)
]
如您所见,对于名字和姓氏,我们可以使用索引来查找正确的字符串。但是为了分割信息,我们必须使用字典,因为我们不知道输入数据的顺序。但显然你也可以在第一部分使用字典。
重要的部分是 person.save()
行。您不必以任何不同的方式对待 Django CharFields。您可以将它们视为字符串。请不要忘记在进行更改后调用 model_instance.save()
。
此外,如您所见,最好使用 QuerySet Iterator 迭代数据点,因为如果您不使用它,迭代大数据集将是一个问题。
有关何时使用 iterator()
的更多信息,请参阅此处:iterator()