能够使用SQLAlchemy反转删除的策略

时间:2012-11-06 18:09:40

标签: python sqlalchemy

我有一系列由Python / SQLAlchemy维护的相关表。如果我删除特定表中的行,我希望能够在将来的某个时刻撤消该删除,以防出现错误。我可以使用is_deleted列并对其进行过滤,但是当我查询其他表以获取相关数据时,这会变得很痛苦。我可以向所有其他表添加一个is_deleted列,当删除主表中的一行时,将它们全部切换。但是对于所有表上的每个查询,我都必须在is_deleted上进行过滤。它可以做到,但我希望有更好的策略。

一种想法是将所有已删除的数据移动到另一组表,这些表仅存储已删除的数据。但是我不清楚SQLAlchemy是否允许我切换与特定对象相关联的表。我认为这将是首选的解决方案,但我不知道是否可以做到。

另一个想法是我可以运行第二个数据库,然后复制已删除的数据。但这增加了我想避免的一层管理复杂性。

任何想法都会受到赞赏。

2 个答案:

答案 0 :(得分:4)

很多人都做了“is_deleted”的事情,我同意我也不喜欢它,尽管我们在PreFilteredQuery确实有这方面的配方。

正如其他人所建议的那样,您正在寻找的是“版本化”配方。我们有一个全面的例子,将数据副本存储在SQLAlchemy文档中Versioned Objects引入的单独版本表中。

在这里,我已经调整了该示例中使用的一些技术,以生成更直接的配方,专门仅跟踪“已删除”的对象,并包括“恢复”功能,该功能将“恢复”给定的行回到主表。所以它没有那么多“SQLAlchemy允许我切换与特定对象相关联的表”,它更像是创建了另一个映射类,类似于主要的映射类,它也可以用于在您请求时“反转”删除。关于__main__的一行以下的所有内容都是概念验证。

from sqlalchemy.orm import Session, object_session
from sqlalchemy import event

def preserve_deleted(class_):
    def copy_col(col):
        newcol = col.copy()
        newcol.constraints = set()
        return newcol
    keys = class_.__table__.c.keys()
    cols = dict(
        (col.key, copy_col(col)) for col in class_.__table__.c
    )
    cols['__tablename__'] = "%s_deleted" % class_.__table__.name

    class History(object):
        def restore(self):
            sess = object_session(self)
            sess.delete(self)
            sess.add(copy_inst(self, class_))

    hist_class = type(
                    '%sDeleted' % class_.__name__,
                    (History, Base),
                    cols)

    def copy_inst(fromobj, tocls):
        return tocls(**dict(
                        (key, getattr(fromobj, key))
                        for key in keys
                    ))
    @event.listens_for(Session, 'before_flush')
    def check_deleted(session, flush_context, instances):
        for del_ in session.deleted:
            if isinstance(del_, class_):
                h = copy_inst(del_, hist_class)
                session.add(h)
    class_.deleted = hist_class
    return class_

if __name__ == '__main__':

    from sqlalchemy.ext.declarative import declarative_base
    from sqlalchemy import Column, ForeignKey, Integer, String
    from sqlalchemy.orm import relationship, Session
    from sqlalchemy import create_engine

    Base = declarative_base()

    @preserve_deleted
    class A(Base):
        __tablename__ = "a"

        id = Column(Integer, primary_key=True)
        data1 = Column(String)
        data2 = Column(String)

    @preserve_deleted
    class B(Base):
        __tablename__ = 'b'
        id = Column(Integer, primary_key=True)
        data1 = Column(String)
        a_id = Column(Integer, ForeignKey('a.id'))
        a = relationship("A")

    e = create_engine('sqlite://', echo=True)

    Base.metadata.create_all(e)

    s = Session(e)

    a1, a2, a3, a4 = \
        A(data1='a1d1', data2='a1d2'),\
        A(data1='a2d1', data2='a2d2'),\
        A(data1='a3d1', data2='a3d2'),\
        A(data1='a4d1', data2='a4d2')

    b1, b2, b3, b4 = \
        B(data1='b1', a=a1),\
        B(data1='b2', a=a1),\
        B(data1='b3', a=a3),\
        B(data1='b4', a=a4)

    s.add_all([
        a1, a2, a3, a4,
        b1, b2, b3, b4
    ])
    s.commit()

    assert s.query(A.id).order_by(A.id).all() == [(1, ), (2, ), (3, ), (4, )]
    assert s.query(B.id).order_by(B.id).all() == [(1, ), (2, ), (3, ), (4, )]

    s.delete(a2)
    s.delete(b2)
    s.delete(b3)
    s.delete(a3)
    s.commit()

    assert s.query(A.id).order_by(A.id).all() == [(1, ), (4, )]
    assert s.query(B.id).order_by(B.id).all() == [(1, ), (4, )]

    a2_deleted = s.query(A.deleted).filter(A.deleted.id == 2).one()
    a2_deleted.restore()

    b3_deleted = s.query(B.deleted).filter(B.deleted.id == 3).one()
    a3_deleted = s.query(A.deleted).filter(A.deleted.id == 3).one()
    b3_deleted.restore()
    a3_deleted.restore()

    s.commit()

    assert s.query(A.id).order_by(A.id).all() == [(1, ), (2, ), (3, ), (4, )]
    assert s.query(B.id).order_by(B.id).all() == [(1, ), (3, ), (4, )]

答案 1 :(得分:1)

我会尝试实现与django-reversion类似的东西。

这意味着您将拥有一个可以包含任何其他表的序列化数据的表,以及有关该表的信息等等。

以django-reversion的Version model为例。 content_type字段是指包含模型信息的Django模型,在您的情况下,它可能只是一个包含表名的char字段(如果你有大量的表,内容类型表会更好)

然后,您可以在每个insertupdate之后添加一些代码,您的版本表也会更新。 每当你想要恢复任何东西时,你只需从版本表中获取序列化数据并重新插入记录。

可能会有一些警告,比如M2M,级联删除等等。但我会从那里开始。