python sqlite3,我多久要提交一次?

时间:2016-03-27 03:31:40

标签: python sql sqlite

我有一个for循环,它使用我编写的sqlite管理器类对数据库进行了很多更改,但我不确定我必须提交多长时间......

for i in list:
    c.execute('UPDATE table x=y WHERE foo=bar')
    conn.commit()
    c.execute('UPDATE table x=z+y WHERE foo=bar')
    conn.commit()

基本上我的问题是我是否必须在那里调用两次提交,或者我是否可以在我做出两次更改之后再调用一次?

1 个答案:

答案 0 :(得分:21)

在每次数据库更改后的过程结束时是否一次调用conn.commit()取决于几个因素。

并发读者看到的内容

这是每个人第一眼就想到的:当提交对数据库的更改时,对其他连接变得可见。除非提交,否则它仅在本地可见,用于进行更改的连接。由于sqlite的并发功能有限,只能在事务处理时读取数据库。

您可以通过运行following script并调查其输出来调查会发生什么:

import os
import sqlite3

_DBPATH = "./q6996603.sqlite"

def fresh_db():
    if os.path.isfile(_DBPATH):
        os.remove(_DBPATH)
    with sqlite3.connect(_DBPATH) as conn:
        cur = conn.cursor().executescript("""
            CREATE TABLE "mytable" (
                "id" INTEGER PRIMARY KEY AUTOINCREMENT, -- rowid
                "data" INTEGER
            );
            """)
    print "created %s" % _DBPATH

# functions are syntactic sugar only and use global conn, cur, rowid

def select():
    sql = 'select * from "mytable"'
    rows = cur.execute(sql).fetchall()
    print "   same connection sees", rows
    # simulate another script accessing tha database concurrently
    with sqlite3.connect(_DBPATH) as conn2:
        rows = conn2.cursor().execute(sql).fetchall()
    print "   other connection sees", rows

def count():
    print "counting up"
    cur.execute('update "mytable" set data = data + 1 where "id" = ?', (rowid,))

def commit():
    print "commit"
    conn.commit()

# now the script
fresh_db()
with sqlite3.connect(_DBPATH) as conn:
    print "--- prepare test case"
    sql = 'insert into "mytable"(data) values(17)'
    print sql
    cur = conn.cursor().execute(sql)
    rowid = cur.lastrowid
    print "rowid =", rowid
    commit()
    select()
    print "--- two consecutive w/o commit"
    count()
    select()
    count()
    select()
    commit()
    select()
    print "--- two consecutive with commit"
    count()
    select()
    commit()
    select()
    count()
    select()
    commit()
    select()

输出:

$ python try.py 
created ./q6996603.sqlite
--- prepare test case
insert into "mytable"(data) values(17)
rowid = 1
commit
   same connection sees [(1, 17)]
   other connection sees [(1, 17)]
--- two consecutive w/o commit
counting up
   same connection sees [(1, 18)]
   other connection sees [(1, 17)]
counting up
   same connection sees [(1, 19)]
   other connection sees [(1, 17)]
commit
   same connection sees [(1, 19)]
   other connection sees [(1, 19)]
--- two consecutive with commit
counting up
   same connection sees [(1, 20)]
   other connection sees [(1, 19)]
commit
   same connection sees [(1, 20)]
   other connection sees [(1, 20)]
counting up
   same connection sees [(1, 21)]
   other connection sees [(1, 20)]
commit
   same connection sees [(1, 21)]
   other connection sees [(1, 21)]
$

所以这取决于你是否可以忍受这样一种情况:一个当前的阅读器,无论是在同一个剧本中还是在另一个程序中,有时会被两个人关闭。

当要进行大量更改时,另外两个方面进入场景:

效果

数据库更改的性能在很大程度上取决于您的操作方式。已经注明为FAQ

  

实际上,SQLite很容易在普通台式计算机上每秒执行50,000或更多INSERT语句。但它每秒只会进行几十次交易。 [...]

了解此处的详细信息绝对有帮助,因此请不要犹豫,按照link进行深入了解。另请参阅此awsome analysis。它是用C语言编写的,但结果与Python中的结果相似。

注意:虽然两个资源都引用INSERT,但对于相同的参数,UPDATE的情况将大致相同。

完全锁定数据库

如上所述,open(未提交)事务将阻止并发连接的更改。因此,通过执行它们并共同提交整个数据库,将许多更改捆绑到单个事务中是有意义的。

不幸的是,有时候,计算这些变化可能需要一些时间。当并发访问是一个问题时,您不希望长时间锁定您的数据库。因为以某种方式收集待处理的UPDATEINSERT语句会变得相当棘手,这通常会让您在性能和排他锁定之间进行权衡。