SQLAlchemy - 针对多个表映射类,其中一个是只读的

时间:2012-12-21 09:57:30

标签: database database-design sqlalchemy

我有一个foobar概念,由'foobar'表示,'foobar_data_cache'表是数据库,'Foobar'类是python。 'foobar'表表示有关概念的一些数据,'foobar_data_cache'表表示有关概念的一些其他数据,数据源自数据库中的许多其他信息,并由数据库触发器计算。为了保持一致性,从'foobar_data_cache'表中撤消了INSERT,UPDATE和DELETE权限。

使用SQLAlchemy我想将'Foobar'类映射到带有连接的两个表'foobar'和'foobar_data_cache'。没有理由使用另一个类来表示'foobar_data_cache'表中的数据,并在这两个类之间建立关系,因为两个表中的数据密切相关。实际上,从数据库的角度来看,两个表之间存在一对一的关系,保证如下:
  - 'foobar_data_cache'的主键也是引用'foobar'主键的外键   - 以及一个触发器,用于检查'foobar'中的每一行是否在'foobar_data_cache'中有相应的行

我的问题是,当我尝试使用SQLAlchemy ORM持久保存新的Foobar对象时,它会尝试为'foobar_data_cache'表插入一些行,我想阻止它。

那么,是否有可能以一种将'foobar_data_cache'表视为只读的方式配置SQLAlchemy?如果是的话,怎么样?

以下是解释我的问题的代码:

from sqlalchemy import (
    Table,
    Column,
    Integer,
    String,
    ForeignKeyConstraint,
    join,
    create_engine,
    )
from sqlalchemy.orm import (
    column_property,
    sessionmaker,
    )
from sqlalchemy.schema import (
    FetchedValue,
    )
from sqlalchemy.ext.declarative import declarative_base

Base = declarative_base()

_foobar_table = Table('foobar', Base.metadata,
        Column('id', Integer, primary_key=True),
        Column('some_data', String),
    )

_foobar_data_cache_table = Table('foobar_data_cache', Base.metadata,
        Column('foobar_id', Integer, primary_key=True),
        Column('computed_data', String, server_default=FetchedValue()),
        ForeignKeyConstraint(['foobar_id'], ['foobar.id']),
    )

class Foobar(Base):
    __table__ = _foobar_table.join(_foobar_data_cache_table)
    _id = column_property(_foobar_table.c.id, _foobar_data_cache_table.c.foobar_id)

    def __init__(self, some_data):
        self.some_data = some_data

if __name__ == '__main__':
    engine = create_engine('postgresql://tester@localhost:5432/mytestdb')
    Session = sessionmaker(bind=engine)
    session = Session()

    my_foobar = Foobar('Dummy data')
    session.add(my_foobar)
    session.commit()

以下是创建两个表的SQL命令:

CREATE TABLE foobar (
  id int NOT NULL DEFAULT -2147483648,
  some_data varchar NOT NULL,
  CONSTRAINT pk_foobar PRIMARY KEY (id)
);

CREATE TABLE foobar_data_cache (
  foobar_id int NOT NULL,
  computed_data varchar NOT NULL,
  CONSTRAINT pk_foobar_data_cache PRIMARY KEY (foobar_id),
  CONSTRAINT fk_foobar_data_cache_foobar_1 FOREIGN KEY (foobar_id)
    REFERENCES foobar (id) MATCH FULL
    ON UPDATE CASCADE ON DELETE CASCADE
);  

注意:
有些人可能想知道为什么我将数据分成两个不同的表,考虑到它们之间是一对一的关系。通过在计算列上使用单个表和FetchedValue构造(请参阅How to persist only a subset of the mapped columns on SQLAlchemy?),可以轻松解决该问题。 嗯,这有点复杂,但我会尝试解释。首先,上面没有解释的其他事项是:
  - 我使用PostgreSQL 8.4,除其他外,它不能具有可延迟的UNIQUE约束   - 我的列都没有接受NULL值
  - 'foobar_data_cache'中的某些列具有唯一约束(不可延迟)
  - 计算'foobar_data_cache'中数据的触发器将延迟到事务结束。实际上,这是因为它需要来自其他表的信息,这些信息只能在插入'foobar'之后插入,因为外键约束。

也就是说,在使用单个表的情况下,这意味着由于NOT-NULL约束,我必须为我的计算列使用临时虚拟值。我的触发器最终会在事务结束时覆盖它。而问题是关于可靠性。实际上,在另一个事务T1正在执行时尝试插入新的“foobar”的新事务Tx将失败,因为唯一列的默认虚拟值已经存在于与执行事务T1相对应的行中。我可以为具有唯一约束的列生成随机虚拟值,但我不喜欢这种做事风格。

1 个答案:

答案 0 :(得分:2)

如果ORM没有表的主键,ORM将跳过任何INSERT / UPDATE / DELETE。在这种情况下,exclude_properties将实现此目的,请注意复合“PK”列已消失,因为我们不关心“foobar_id”的值:

from sqlalchemy import (
    Table,
    Column,
    Integer,
    String,
    ForeignKeyConstraint,
    join,
    create_engine,
    )
from sqlalchemy.orm import (
    column_property,
    sessionmaker,
    )
from sqlalchemy.schema import (
    FetchedValue,
    )
from sqlalchemy.ext.declarative import declarative_base

Base = declarative_base()

_foobar_table = Table('foobar', Base.metadata,
        Column('id', Integer, primary_key=True),
        Column('some_data', String),
    )

_foobar_data_cache_table = Table('foobar_data_cache', Base.metadata,
        Column('foobar_id', Integer, primary_key=True),
        Column('computed_data', String, server_default=FetchedValue()),
        ForeignKeyConstraint(['foobar_id'], ['foobar.id']),
    )

class Foobar(Base):
    __table__ = _foobar_table.join(_foobar_data_cache_table)
    _id = _foobar_table.c.id

    def __init__(self, some_data):
        self.some_data = some_data

    __mapper_args__ = {"exclude_properties": [_foobar_data_cache_table.c.foobar_id]}

if __name__ == '__main__':
    engine = create_engine('postgresql://scott:tiger@localhost/test', echo=True)

    Base.metadata.drop_all(engine)
    Base.metadata.create_all(engine)

    Session = sessionmaker(bind=engine)
    session = Session()

    my_foobar = Foobar('Dummy data')
    session.add(my_foobar)

    # simulate your trigger...
    session.flush()
    assert session.scalar(_foobar_data_cache_table.count()) == 0
    session.execute(
        _foobar_data_cache_table.insert(),
        params=dict(
                foobar_id=my_foobar._id,
                computed_data="some computed data"
                )
    )

    session.commit()

    obj = session.query(Foobar).first()
    assert obj.computed_data == "some computed data"

如果你使用传统的relationship()作为_foobar_foobar_data_cache_table之间的链接,而不是合并到一起,那么整个映射将方式更简单映射join()