在同一个Flask-SQLAlchemy模型中使用多个POSTGRES数据库和架构

时间:2018-08-01 14:54:44

标签: postgresql flask sqlalchemy flask-sqlalchemy sharding

在这里我将非常具体,因为已经提出了类似的问题,但是没有一种解决方案可以解决这个问题。

我正在一个有四个postgres数据库的项目中,但是为了简单起见,我们说有2个。即A和B

A,B代表两个地理位置,但是数据库中的表和架构是相同的。

样本模型:

from flask_sqlalchemy import SQLAlchemy
from sqlalchemy import *
from sqlalchemy.ext.declarative import declarative_base

db = SQLAlchemy()
Base = declarative_base()

class FRARecord(Base):
    __tablename__ = 'tb_fra_credentials'

    recnr = Column(db.Integer, primary_key = True)
    fra_code = Column(db.Integer)
    fra_first_name = Column(db.String)

此模型已在两个数据库中复制,但是具有不同的架构,因此要使其在A中工作,我需要这样做:

__table_args__ = {'schema' : 'A_schema'}

我想使用一个单一的内容提供者,该提供者可以访问数据库,但是具有相同的方法:

class ContentProvider():
    def __init__(self, database):
        self.database = database

    def get_fra_list():
        logging.debug("Fetching fra list")
        fra_list = db.session.query(FRARecord.fra_code)

两个问题是,如何确定要指向的数据库以及如何不为不同的模式复制模型代码(这是Postgres特定的问题)

这是我到目前为止尝试过的:

1)我为每个模型制作了单独的文件并继承了它们,所以:

class FRARecordA(FRARecord):
    __table_args__ = {'schema' : 'A_schema'}

这似乎不起作用,因为出现错误:

"Can't place __table_args__ on an inherited class with no table."

这意味着在声明了db.Model(在其父级中)之后,我无法设置该参数

2)所以我尝试对多重继承做同样的事情,

class FRARecord():
    recnr = Column(db.Integer, primary_key = True)
    fra_code = Column(db.Integer)
    fra_first_name = Column(db.String)

class FRARecordA(Base, FRARecord):
    __tablename__ = 'tb_fra_credentials'
    __table_args__ = {'schema' : 'A_schema'}

但出现了可预测的错误:

"CompileError: Cannot compile Column object until its 'name' is assigned."

很明显,我不能将Column对象移到FRARecordA模型,而不必对B也重复它们(实际上有4个数据库和更多模型)。

3)最后,我正在考虑进行某种分片(这似乎是正确的方法),但是我找不到如何进行此操作的示例。我的感觉是,我只会使用这样的单个对象:

class FRARecord(Base):
    __tablename__ = 'tb_fra_credentials'

    @declared_attr
    def __table_args__(cls):
        #something where I go through the values in bind keys like
        for key, value in self.db.app.config['SQLALCHEMY_BINDS'].iteritems():
            # Return based on current session maybe? And then have different sessions in the content provider?

    recnr = Column(db.Integer, primary_key = True)
    fra_code = Column(db.Integer)
    fra_first_name = Column(db.String)

请明确说明,我访问不同数据库的意图如下:

app.config['SQLALCHEMY_DATABASE_URI']='postgresql://%(user)s:\
%(pw)s@%(host)s:%(port)s/%(db)s' % POSTGRES_A

app.config['SQLALCHEMY_BINDS']={'B':'postgresql://%(user)s:%(pw)s@%(host)s:%(port)s/%(db)s' % POSTGRES_B,
                                  'C':'postgresql://%(user)s:%(pw)s@%(host)s:%(port)s/%(db)s' % POSTGRES_C,
                                  'D':'postgresql://%(user)s:%(pw)s@%(host)s:%(port)s/%(db)s' % POSTGRES_D
                                 }

POSTGRES词典包含所有用于连接数据的键

我假设使用继承的对象,我将像这样连接到正确的对象(这样sqlalchemy查询将自动知道):

class FRARecordB(FRARecord):
    __bind_key__ = 'B'
    __table_args__ = {'schema' : 'B_schema'}

1 个答案:

答案 0 :(得分:3)

最后找到了解决方案。

本质上,我没有为每个数据库创建新类,只是为每个数据库使用了不同的数据库连接。

这种方法本身很常见,棘手的部分(我找不到示例)处理模式差异。我最终这样做:

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker

Session = sessionmaker()

class ContentProvider():

    db = None
    connection = None
    session = None

    def __init__(self, center):
        if center == A:
            self.db = create_engine('postgresql://%(user)s:%(pw)s@%(host)s:%(port)s/%(db)s' % POSTGRES_A, echo=echo, pool_threadlocal=True)
            self.connection = self.db.connect()
            # It's not very clean, but this was the extra step. You could also set specific connection params if you have multiple schemas
            self.connection.execute('set search_path=A_schema')
        elif center == B:
            self.db = create_engine('postgresql://%(user)s:%(pw)s@%(host)s:%(port)s/%(db)s' % POSTGRES_B, echo=echo, pool_threadlocal=True)
            self.connection = self.db.connect()
            self.connection.execute('set search_path=B_schema')

    def get_fra_list(self):
        logging.debug("Fetching fra list")
        fra_list = self.session.query(FRARecord.fra_code)
        return fra_list