Question

我有一个使用Pyramid / SQLAlchemy / Postgresql构建的Web应用程序，允许用户管理一些数据，而且这些数据几乎完全独立于不同的用户。说，Alice访问alice.domain.com并且能够上传图片和文档，并且Bob访问bob.domain.com并且还能够上传图片和文档。 Alice永远不会看到Bob创建的任何内容，反之亦然（这是一个简化的例子，实际上在多个表中可能有很多数据，但想法是相同的）。

现在，在数据库后端组织数据的最简单方法是使用单个数据库，其中每个表（pictures和documents）都有user_id字段，因此，基本上，要获得所有爱丽丝的照片，我可以做类似

的事情

user_id = _figure_out_user_id_from_domain_name(request)
pictures = session.query(Picture).filter(Picture.user_id==user_id).all()

这一切都很简单，但有一些缺点

我需要记住在进行查询时总是使用额外的过滤条件，否则Alice可能会看到Bob的图片;
如果有很多用户，表格可能会变得很大
在多台计算机之间拆分Web应用程序可能很棘手

所以我认为以某种方式分割每个用户的数据会非常好。我可以想到两种方法：

在同一个数据库中为Alice和Bob的图片和文档设置单独的表（Postgres'Schemas似乎是在这种情况下使用的正确方法）：

documents_alice
documents_bob
pictures_alice
pictures_bob

然后，使用一些黑魔法，根据当前请求的域“将”所有查询“路由”到一个或另一个表：

_use_dark_magic_to_configure_sqlalchemy('alice.domain.com')
pictures = session.query(Picture).all()  # selects all Alice's pictures from "pictures_alice" table
...
_use_dark_magic_to_configure_sqlalchemy('bob.domain.com')
pictures = session.query(Picture).all()  # selects all Bob's pictures from "pictures_bob" table

为每个用户使用单独的数据库：
```
- database_alice
   - pictures
   - documents
- database_bob
   - pictures
   - documents 
```
这似乎是最干净的解决方案，但我不确定多个数据库连接是否需要更多RAM和其他资源，从而限制了可能的“租户”数量。

所以，问题是，这一切都有意义吗？如果是，如何配置SQLAlchemy以在每个HTTP请求上动态修改表名（对于选项1）或者维护到不同数据库的连接池并为每个请求使用正确的连接（对于选项2）？

Answer 1

在思考jd的答案后，我能够为postgresql 9.2，sqlalchemy 0.8和flask 0.9框架获得相同的结果：

from sqlalchemy import event
from sqlalchemy.pool import Pool
@event.listens_for(Pool, 'checkout')
def on_pool_checkout(dbapi_conn, connection_rec, connection_proxy):
    tenant_id = session.get('tenant_id')
    cursor = dbapi_conn.cursor()
    if tenant_id is None:
        cursor.execute("SET search_path TO public, shared;")
    else:
        cursor.execute("SET search_path TO t" + str(tenant_id) + ", shared;")
    dbapi_conn.commit()
    cursor.close()

Answer 2

对我来说，在连接池级别而不是在会话中设置搜索路径非常有效。此示例使用Flask及其线程本地代理来传递模式名称，因此您必须更改schema = current_schema._get_current_object()及其周围的try块。

from sqlalchemy.interfaces import PoolListener
class SearchPathSetter(PoolListener):
    '''
    Dynamically sets the search path on connections checked out from a pool.
    '''
    def __init__(self, search_path_tail='shared, public'):
        self.search_path_tail = search_path_tail

    @staticmethod
    def quote_schema(dialect, schema):
        return dialect.identifier_preparer.quote_schema(schema, False)

    def checkout(self, dbapi_con, con_record, con_proxy):
        try:
            schema = current_schema._get_current_object()
        except RuntimeError:
            search_path = self.search_path_tail
        else:
            if schema:
                search_path = self.quote_schema(con_proxy._pool._dialect, schema) + ', ' + self.search_path_tail
            else:
                search_path = self.search_path_tail
        cursor = dbapi_con.cursor()
        cursor.execute("SET search_path TO %s;" % search_path)
        dbapi_con.commit()
        cursor.close()

在发动机创建时：

engine = create_engine(dsn, listeners=[SearchPathSetter()])

Answer 3

好的，我最后在每个请求的开头使用Pyramid的search_path事件修改了NewRequest：

from pyramid import events

def on_new_request(event):

    schema_name = _figire_out_schema_name_from_request(event.request)
    DBSession.execute("SET search_path TO %s" % schema_name)


def app(global_config, **settings):
    """ This function returns a WSGI application.

    It is usually called by the PasteDeploy framework during
    ``paster serve``.
    """

    ....

    config.add_subscriber(on_new_request, events.NewRequest)
    return config.make_wsgi_app()

工作得很好，只要您将事务管理留给Pyramid（即不要手动提交/回滚事务，让Pyramid在请求结束时执行此操作） - 这是正确的，因为手动提交事务不是好的方法无论如何。

SQLAlchemy的多租户

3 个答案: