我有以下模型,其中TableA和TableB具有1对1的关系:
class TableA(db.Model):
id = Column(db.BigInteger, primary_key=True)
title = Column(String(1024))
table_b = relationship('TableB', uselist=False, back_populates="table_a")
class TableB(db.Model):
id = Column(BigInteger, ForeignKey(TableA.id), primary_key=True)
a = relationship('TableA', back_populates='table_b')
name = Column(String(1024))
当我插入1条记录时,一切顺利:
rec_a = TableA(title='hello')
rec_b = TableB(a=rec_a, name='world')
db.session.add(rec_b)
db.session.commit()
但是当我尝试为大量记录执行此操作时:
bulk_ = []
for title, name in zip(titles, names):
rec_a = TableA(title=title)
bulk_.append(TableB(a=rec_a, name=name))
db.session.bulk_save_objects(bulk_)
db.session.commit()
我得到以下异常:
sqlalchemy.exc.InternalError: (pymysql.err.InternalError) (1364, "Field 'id' doesn't have a default value")
我做错了吗?我是否错误地配置了模型? 有没有办法批量提交这种类型的数据?
答案 0 :(得分:3)
您看到的错误是由Mysql抛出的。它抱怨将记录插入table_b
的尝试违反了外键约束。
一种技术可能是在一个批量语句中写入所有标题,然后在第二个批量语句中写入所有名称。此外,我从未成功地将关系传递给批量操作,此方法依赖于插入简单值。
bulk_titles = [TableA(title=title) for title in titles]
session.bulk_save_objects(bulk_titles, return_defauls=True)
bulk_names = [TableB(id=title.id, name=name) for title, name in zip(bulk_titles, names)]
session.bulk_save_objects(bulk_names)
上面需要 return_defaults=True
因为我们在第二次批量操作中需要title.id
。但是这greatly reduces the performance gains of the bulk operation
为避免return_defauts=True
导致性能下降,您可以从应用程序而不是数据库生成主键,例如:使用uuids,或获取每个表中的max id并从该起始值生成范围。
另一种技术可能是使用sqlalchemy核心或纯文本编写批量插入语句。