我有一个for循环,它使用我编写的sqlite管理器类对数据库进行了很多更改,但我不确定我必须提交多长时间......
for i in list:
c.execute('UPDATE table x=y WHERE foo=bar')
conn.commit()
c.execute('UPDATE table x=z+y WHERE foo=bar')
conn.commit()
基本上我的问题是我是否必须在那里调用两次提交,或者我是否可以在我做出两次更改之后再调用一次?
答案 0 :(得分:21)
在每次数据库更改后的过程结束时是否一次调用conn.commit()
取决于几个因素。
这是每个人第一眼就想到的:当提交对数据库的更改时,对其他连接变得可见。除非提交,否则它仅在本地可见,用于进行更改的连接。由于sqlite
的并发功能有限,只能在事务处理时读取数据库。
您可以通过运行following script并调查其输出来调查会发生什么:
import os
import sqlite3
_DBPATH = "./q6996603.sqlite"
def fresh_db():
if os.path.isfile(_DBPATH):
os.remove(_DBPATH)
with sqlite3.connect(_DBPATH) as conn:
cur = conn.cursor().executescript("""
CREATE TABLE "mytable" (
"id" INTEGER PRIMARY KEY AUTOINCREMENT, -- rowid
"data" INTEGER
);
""")
print "created %s" % _DBPATH
# functions are syntactic sugar only and use global conn, cur, rowid
def select():
sql = 'select * from "mytable"'
rows = cur.execute(sql).fetchall()
print " same connection sees", rows
# simulate another script accessing tha database concurrently
with sqlite3.connect(_DBPATH) as conn2:
rows = conn2.cursor().execute(sql).fetchall()
print " other connection sees", rows
def count():
print "counting up"
cur.execute('update "mytable" set data = data + 1 where "id" = ?', (rowid,))
def commit():
print "commit"
conn.commit()
# now the script
fresh_db()
with sqlite3.connect(_DBPATH) as conn:
print "--- prepare test case"
sql = 'insert into "mytable"(data) values(17)'
print sql
cur = conn.cursor().execute(sql)
rowid = cur.lastrowid
print "rowid =", rowid
commit()
select()
print "--- two consecutive w/o commit"
count()
select()
count()
select()
commit()
select()
print "--- two consecutive with commit"
count()
select()
commit()
select()
count()
select()
commit()
select()
输出:
$ python try.py
created ./q6996603.sqlite
--- prepare test case
insert into "mytable"(data) values(17)
rowid = 1
commit
same connection sees [(1, 17)]
other connection sees [(1, 17)]
--- two consecutive w/o commit
counting up
same connection sees [(1, 18)]
other connection sees [(1, 17)]
counting up
same connection sees [(1, 19)]
other connection sees [(1, 17)]
commit
same connection sees [(1, 19)]
other connection sees [(1, 19)]
--- two consecutive with commit
counting up
same connection sees [(1, 20)]
other connection sees [(1, 19)]
commit
same connection sees [(1, 20)]
other connection sees [(1, 20)]
counting up
same connection sees [(1, 21)]
other connection sees [(1, 20)]
commit
same connection sees [(1, 21)]
other connection sees [(1, 21)]
$
所以这取决于你是否可以忍受这样一种情况:一个当前的阅读器,无论是在同一个剧本中还是在另一个程序中,有时会被两个人关闭。
当要进行大量更改时,另外两个方面进入场景:
数据库更改的性能在很大程度上取决于您的操作方式。已经注明为FAQ:
实际上,SQLite很容易在普通台式计算机上每秒执行50,000或更多INSERT语句。但它每秒只会进行几十次交易。 [...]
了解此处的详细信息绝对有帮助,因此请不要犹豫,按照link进行深入了解。另请参阅此awsome analysis。它是用C语言编写的,但结果与Python中的结果相似。
注意:虽然两个资源都引用INSERT
,但对于相同的参数,UPDATE
的情况将大致相同。
如上所述,open(未提交)事务将阻止并发连接的更改。因此,通过执行它们并共同提交整个数据库,将许多更改捆绑到单个事务中是有意义的。
不幸的是,有时候,计算这些变化可能需要一些时间。当并发访问是一个问题时,您不希望长时间锁定您的数据库。因为以某种方式收集待处理的UPDATE
和INSERT
语句会变得相当棘手,这通常会让您在性能和排他锁定之间进行权衡。