“ResourceClosedError:交易已关闭”,芹菜节拍和sqlalchemy +金字塔应用程序错误

时间:2013-05-02 12:58:47

标签: sqlalchemy celery pyramid

我有一个名为mainsite的金字塔应用。

该站点以异步方式工作,主要是通过从视图启动的线程来执行后端操作。

它使用sqlalchemy连接到mysql,并使用ZopeTransactionExtension进行会话管理。

到目前为止,应用程序运行良好。

我需要在其上运行定期作业,它需要使用从视图中启动的一些相同的异步函数。

我使用了apscheduler,但遇到了问题。所以我想把celery beat作为一个单独的过程,将mainapp视为一个库并导入要使用的函数。

我的芹菜配置看起来像这样:

from datetime import timedelta
from api.apiconst import RERUN_CHECK_INTERVAL, AUTOMATION_CHECK_INTERVAL, \
    AUTH_DELETE_TIME

BROKER_URL = 'sqla+mysql://em:em@localhost/edgem'
CELERY_RESULT_BACKEND = "database"
CELERY_RESULT_DBURI = 'mysql://em:em@localhost/edgem'

CELERYBEAT_SCHEDULE = {
    'rerun': {
        'task': 'tasks.rerun_scheduler',
        'schedule': timedelta(seconds=RERUN_CHECK_INTERVAL)
    },
    'automate': {
        'task': 'tasks.automation_scheduler',
        'schedule': timedelta(seconds=20)
    },
    'remove-tokens': {
        'task': 'tasks.token_remover_scheduler',
        'schedule': timedelta(seconds=2 * 24 * 3600 )
    },
}

CELERY_TIMEZONE = 'UTC'

tasks.py是

from celery import Celery
celery = Celery('tasks')
celery.config_from_object('celeryconfig')


@celery.task
def rerun_scheduler():
    from mainsite.task import check_update_rerun_tasks
    check_update_rerun_tasks()


@celery.task
def automation_scheduler():
    from mainsite.task import automate
    automate()


@celery.task
def token_remover_scheduler():
    from mainsite.auth_service import delete_old_tokens
    delete_old_tokens()

请记住,所有上述功能都会立即返回,但如果需要,则启动线程

线程通过transaction.commit() after session.add(object)将对象保存到db中。

问题在于整个事情就像宝石一样只有大约30分钟。在有ResourceClosedError: The transaction is closed的任何地方发生transaction.commit()错误之后。我不确定是什么问题,我需要帮助排除故障。

我在任务中导入的原因是为了摆脱这个错误。考虑每次需要运行任务时导入是一个好主意,我每次都可以获得一个新的事务,但看起来并非如此。

1 个答案:

答案 0 :(得分:9)

根据我的经验,尝试重用配置为与Pyramid一起使用的会话(使用ZopeTransactionExtension等)与Celery工作程序会导致难以调试的混乱。

ZopeTransactionExtension将SQLAlchemy会话绑定到Pyramid的请求 - 响应周期 - 事务自动启动并提交或回滚,您通常不应该在代码中使用transaction.commit() - 如果一切正常,ZTE将提交所有内容,如果您的代码引发异常,您的交易将被回滚。

使用Celery,您需要手动管理SQLAlchemy会话,中兴通讯阻止您这样做,因此您需要以不同的方式配置DBSession

像这样简单的东西可行:

DBSession = None

def set_dbsession(session):
    global DBSession
    if DBSession is not None:
        raise AttributeError("DBSession has been already set to %s!" % DBSession)

    DBSession = session

然后从金字塔启动代码

def main(global_config, **settings):
    ...
    set_dbsession(scoped_session(sessionmaker(extension=ZopeTransactionExtension())))

使用Celery它有点棘手 - 我最终为Celery创建了一个自定义启动脚本,我在其中配置了会话。

setup.py鸡蛋的worker中:

  entry_points="""
  # -*- Entry points: -*-
  [console_scripts]
  custom_celery = worker.celeryd:start_celery
  custom_celerybeat = worker.celeryd:start_celerybeat
  """,
  )
worker/celeryd.py中的

def initialize_async_session(db_string, db_echo):

    import sqlalchemy as sa
    from db import Base, set_dbsession

    session = sa.orm.scoped_session(sa.orm.sessionmaker(autoflush=True, autocommit=True))
    engine = sa.create_engine(db_string, echo=db_echo)
    session.configure(bind=engine)

    set_dbsession(session)
    Base.metadata.bind = engine


def start_celery():
    initialize_async_session(DB_STRING, DB_ECHO)
    import celery.bin.celeryd
    celery.bin.celeryd.main()

如果您计划将应用程序部署到生产服务器,那么您正在使用“从视图中启动线程以执行后端操作”的一般方法对我来说有点危险 - Web服务器经常回收,杀死或创造新的“工人”,因此通常无法保证每个特定流程能够在当前的请求 - 响应周期之后存活。我从来没有试过这样做,所以也许你会好的:))