在事务中使用GridFS put命令时,pymongo会挂起

时间:2018-08-08 21:45:51

标签: mongodb transactions pymongo gridfs

我正在使用GridFS在我的数据库中存储一些视频文件。我已经更新到MongoDB 4.0,并尝试使用多集合事务模型。我面临的问题是put()命令gridfs挂起了系统。我的使用方式如下:

client = pymongo.MongoClient(mongo_url) 
db = client[db_name]
fs = gridfs.GridFS(db)

现在,我尝试使用如下交易模型:

with db.client.start_session() as session:
    try:
        file_path = "video.mp4"  
        session.start_transaction()

        with open(file_path, 'rb') as f:
            fid = self.fs.put(f, metadata={'sequence_id': '0001'})
        session.commit_transaction()
    except Exception as e:
        raise
    finally:
        session.end_session()

问题是put命令挂起大约一分钟。然后返回,但提交失败。我有一种感觉,这是因为会话对象没有传递给put命令,但是在帮助中没有任何参数将会话作为输入。挂起后,测试失败并显示以下堆栈:

回溯(最近通话最近一次):

    session.commit_transaction()
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/client_session.py", line 393, in commit_transaction
    self._finish_transaction_with_retry("commitTransaction")
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/client_session.py", line 457, in _finish_transaction_with_retry
    return self._finish_transaction(command_name)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/client_session.py", line 452, in _finish_transaction
    parse_write_concern_error=True)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/database.py", line 514, in _command
    client=self.__client)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/pool.py", line 579, in command
    unacknowledged=unacknowledged)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/network.py", line 150, in command
    parse_write_concern_error=parse_write_concern_error)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/helpers.py", line 155, in _check_command_response
    raise OperationFailure(msg % errmsg, code, response)
pymongo.errors.OperationFailure: Transaction 1 has been aborted.

编辑

我尝试将put块替换为:

try:
   gf = self.fs.new_file(metadata={'sequence_id': '0000'})
   gf.write(f)
finally:
   gf.close()

但是,挂起再次发生在gf.close()

我还尝试直接实例化GridIn以便提供会话对象,但失败的原因是:

gin = gridfs.GridIn(root_collection=self.db["fs.files"], session=session)
gin.write(f)
gin.close()

这失败,并显示错误消息:

It is illegal to provide a txnNumber for command createIndexes

1 个答案:

答案 0 :(得分:0)

  

问题是put命令挂起大约一分钟

使用self.fs.put()的第一次尝试实际上并没有使用transactions,只是花了一段时间才上传文件。

然后,在尝试提交(空)事务时完成上传后,由于上传所花费的时间,不幸的是,事务达到了最大生存期限制。参见transactionLifetimeLimitSeconds。默认限制已设置为60秒,以设置最大事务运行时间。

如果您正在考虑提高此限制,请记住,在创建事务快照后,当写入量进入MongoDB时,WiredTiger缓存压力就会增加。只有事务提交后才能释放此缓存压力。这就是6​​0秒默认限制之后的原因。

  

为命令createIndexes提供一个txnNumber是非法的

首先,在多文档事务中不允许,这些操作会影响数据库目录,例如创建或删除集合或索引。

PyMongo GridFS的代码正在尝试为GridFS集合创建索引,当与事务性会话(您可以使用会话但不能使用事务)一起使用时,在服务器上是禁止的。

  

我已经更新到MongoDB 4.0,并尝试使用多集合交易模型

我建议对GridFS使用常规的数据库操作。 MongoDB multi-document事务旨在用于多文档原子性。在文件上传的情况下,我认为没有必要。