如何在 Django 迁移中将模型字段的值拆分为多个模型字段?

时间:2021-03-09 20:02:04

标签: django django-migrations

我想编写一个新的迁移文件,将旧的坏数据改成更好的数据。比如老款是这样的:

from django.db import models

class Person(models.Model):
    fullname = models.CharField(max_length=250, null=True)
    information = models.CharField(max_length=350, null=True)

并且 fullname 的值是这样的:

first_name:George;last_name:Adam Pince Green

which first_namelast_name 始终处于相同的顺序。 信息的价值是这样的:

id_code:0021678913;born_in:Canada;birth_year:1975

birth_year:1990;born_in:Portugal;id_code:0219206431

未订购。 现在我需要编写一个迁移文件,将这个全名信息值拆分为新模型,例如:

from django.db import models


class Person(models.Model):
    first_name = models.CharField(max_length=30, null=True)
    last_name = models.CharField(max_length=50, null=True)
    id_code = models.CharField(max_length=10, null=True)
    born_in = models.CharField(max_length=30, null=True)
    birth_year = models.PositiveSmallIntegerField(null=True)

2 个答案:

答案 0 :(得分:0)

您可以更改新字段,然后使用 django.db.migrations.operations.RunPython 从旧字段中提取值并保存到新字段中。最后删除旧字段。 https://docs.djangoproject.com/en/3.1/ref/migration-operations/#django.db.migrations.operations.RunPython

答案 1 :(得分:0)

对于您的代码,您可以编写如下内容:

from django.db import migrations, models

def ammend_the_data(apps, _):
    Person = apps.get_model('people', 'Person')
    people = Person.objects.all().iterator()

    for person in people:
        fullnamesplit = person.fullname.split(';')
        first_name = fullnamesplit[0].split(':')[1]
        last_name = fullnamesplit[1].split(':')[1]

        informationsplit = person.information.split(';')
        info2 = {}
        for info in informationsplit:
            info3 = info.split(':')
            info2.update({info3[0] : info3[1]})
        
        person.first_name = first_name
        person.last_name = last_name
        person.id_code = info2.get('id_code')
        person.born_in = info2.get('born_in')
        person.birth_year = int(info2.get('birth_year'))

        person.save()



class Migration(migrations.Migration):
    initial = True

    dependencies = [
    ]

    operations = [
        migrations.CreateModel(
            name='Person',
            fields=[
                ('id', models.AutoField(auto_created=True, primary_key=True, serialize=False, verbose_name='ID')),
                ('fullname', models.CharField(max_length=250, null=True)),
                ('information', models.CharField(max_length=350, null=True)),
                
                ('first_name', models.CharField(max_length=30, null=True)),
                ('last_name', models.CharField(max_length=50, null=True)),
                ('id_code', models.CharField(max_length=10, null=True)),
                ('born_in', models.CharField(max_length=30, null=True)),
                ('birth_year', models.PositiveSmallIntegerField(null=True)),
            ],
        ), 
        
        migrations.RunPython(
            code= ammend_the_data)
    ]

如您所见,对于名字和姓氏,我们可以使用索引来查找正确的字符串。但是为了分割信息,我们必须使用字典,因为我们不知道输入数据的顺序。但显然你也可以在第一部分使用字典。

重要的部分是 person.save() 行。您不必以任何不同的方式对待 Django CharFields。您可以将它们视为字符串。请不要忘记在进行更改后调用 model_instance.save()

此外,如您所见,最好使用 QuerySet Iterator 迭代数据点,因为如果您不使用它,迭代大数据集将是一个问题。 有关何时使用 iterator() 的更多信息,请参阅此处:iterator()