SQLAlchemy在多线程应用程序中正确处理会话

时间:2012-03-08 15:06:37

标签: python multithreading session sqlalchemy

我无法理解如何有效地正确打开和关闭数据库会话,正如我所理解的sqlalchemy文档,如果我使用scoped_session来构造我的Session对象,然后使用返回的Session对象来创建会话,它是线程安全的,所以基本上每个线程都会获得它自己的会话,并且不会出现问题。现在下面的例子工作,我把它放在一个无限循环中,看它是否正确关闭会话,如果我正确监视它(在mysql中通过执行“SHOW PROCESSLIST;”),连接只是继续增长,它不会关闭它们,即使我使用了session.close(),甚至在每次运行结束时删除了scoped_session对象。我究竟做错了什么?我在更大的应用程序中的目标是使用所需的最少数量的数据库连接,因为我当前的工作实现在需要它的每个方法中创建一个新会话,并在返回之前关闭它,这似乎是低效的。

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker, scoped_session
from threading import Thread
from Queue import Queue, Empty as QueueEmpty
from models import MyModel


DATABASE_CONNECTION_INFO = 'mysql://username:password@localhost:3306/dbname'


class MTWorker(object):

    def __init__(self, worker_count=5):
        self.task_queue = Queue()
        self.worker_count = worker_count
        self.db_engine = create_engine(DATABASE_CONNECTION_INFO, echo=False)
        self.DBSession = scoped_session(
            sessionmaker(
                autoflush=True,
                autocommit=False,
                bind=self.db_engine
            )
        )

    def _worker(self):
        db_session = self.DBSession()
        while True:
            try:
                task_id = self.task_queue.get(False)
                try:
                    item = db_session.query(MyModel).filter(MyModel.id == task_id).one()
                    # do something with item
                except Exception as exc:
                    # if an error occurrs we skip it
                    continue

                finally:
                    db_session.commit()
                    self.task_queue.task_done()
            except QueueEmpty:
                db_session.close()
                return

    def start(self):
        try:
            db_session = self.DBSession()
            all_items = db_session.query(MyModel).all()
            for item in all_items:
                self.task_queue.put(item.id)

            for _i in range(self.worker_count):
                t = Thread(target=self._worker)
                t.start()

            self.task_queue.join()
        finally:
            db_session.close()
            self.DBSession.remove()


if __name__ == '__main__':
    while True:
        mt_worker = MTWorker(worker_count=50)
        mt_worker.start()

1 个答案:

答案 0 :(得分:38)

您应该只调用create_enginescoped_session一次 进程(每个数据库)。每个人都会得到自己的连接或会话池 (分别),所以你要确保你只创建一个池。只需将其设为全局模块级别即可。如果您需要更频繁地管理会话,则可能不应该使用scoped_session

要做的另一项更改是直接使用DBSession,就好像它是一样 会话。在scoped_session上调用会话方法将是透明的 如果需要,创建一个线程本地会话,并将方法调用转发给 会话。

要注意的另一件事是 pool_size  连接池,哪个 默认为5。对于许多应用程序而言,这很好,但如果您正在创建 很多线程,您可能需要调整该参数

DATABASE_CONNECTION_INFO = 'mysql://username:password@localhost:3306/dbname'
db_engine = create_engine(DATABASE_CONNECTION_INFO, echo=False)
DBSession = scoped_session(
    sessionmaker(
        autoflush=True,
        autocommit=False,
        bind=db_engine
    )
)


class MTWorker(object):

    def __init__(self, worker_count=5):
        self.task_queue = Queue()
        self.worker_count = worker_count
# snip