我有以下select语句(使用sqlite3和pysqlite模块):
self.cursor.execute("SELECT precursor_id FROM MSMS_precursor "+
"JOIN spectrum ON spectrum_id = spectrum_spectrum_id "+
"WHERE spectrum_id = spectrum_spectrum_id "+
"AND ROUND(ion_mz,9) = ? AND ROUND(scan_start_time,4) = ? "+
"AND msrun_msrun_id = ?", select_inputValues)
在Python中运行时需要55秒。在SQLite命令行上直接运行它只需要15ms。现在,我注意到,当它在这一步中时,Python程序进入不间断的睡眠状态(31283 ndeklein 18 0 126m 24m 3192 D 1.0 0.0 2:02.50 python
,顶部输出中的D)并且它从100%CPU下降到大约1%的CPU。现在我在这个查询中注意到了,在运行我询问here的查询时,我也查看了顶部输出。在此期间,顶部还显示它进入不间断的睡眠状态,尽管它在R和D之间来回切换并且仅减慢到50%左右(它会根据D或R状态而波动)。
所以现在我认为这会减慢我的查询速度(如果不间断睡眠与程序速度无关,请纠正我)。如果是这样,我怎样才能确保程序不进入这种状态?
使用Python返回的EXPLAIN QUERY PLAN:
(0, 0, 1, u'SCAN TABLE spectrum (~50000 rows)')
使用sqlite的命令行返回EXPLAIN QUERY PLAN:
0|0|1|SCAN TABLE spectrum (~50000 rows)
0|1|0|SEARCH TABLE MSMS_precursor USING INDEX fk_MSMS_precursor_spectrum_spectrum_id_1 (spectrum_spectrum_id=?) (~2 rows)
使用Python的EXPLAIN返回:
(0, u'Trace', 0, 0, 0, u'', u'00', None)
使用sqlite的EXPLAIN返回:
0|Trace|0|0|0||00|
1|Real|0|1|0|438.718658447|00|
2|Real|0|2|0|692.6345000000001|00|
3|Integer|1|3|0||00|
4|Goto|0|39|0||00|
5|OpenRead|1|33|0|13|00|
6|OpenRead|0|39|0|5|00|
7|OpenRead|2|41|0|keyinfo(1,BINARY)|00|
8|Rewind|1|35|0||00|
9|Column|1|8|5||00|
10|RealAffinity|5|0|0||00|
11|Integer|4|6|0||00|
12|Function|2|5|4|round(2)|02|
13|Ne|2|34|4||6a|
14|Column|1|12|4||00|
15|Ne|3|34|4|collseq(BINARY)|6c|
16|Column|1|0|8||00|
17|IsNull|8|34|0||00|
18|Affinity|8|1|0|d|00|
19|SeekGe|2|34|8|1|00|
20|IdxGE|2|34|8|1|01|
21|IdxRowid|2|7|0||00|
22|Seek|0|7|0||00|
23|Column|1|0|9||00|
24|Column|2|0|10||00|
25|Ne|10|33|9|collseq(BINARY)|6b|
26|Column|0|1|5||00|
27|RealAffinity|5|0|0||00|
28|Integer|9|6|0||00|
29|Function|2|5|11|round(2)|02|
30|Ne|1|33|11||6a|
31|Column|0|0|13||00|
32|ResultRow|13|1|0||00|
33|Next|2|20|0||00|
34|Next|1|9|0||01|
35|Close|1|0|0||00|
36|Close|0|0|0||00|
37|Close|2|0|0||00|
38|Halt|0|0|0||00|
39|Transaction|0|0|0||00|
40|VerifyCookie|0|31|0||00|
41|TableLock|0|33|0|spectrum|00|
42|TableLock|0|39|0|MSMS_precursor|00|
43|Goto|0|5|0||00|
iostat回来了:
io-bash-3.2$ iostat
Linux 2.6.18-194.26.1.el5 (ningal.cluster.lifesci.ac.uk) 06/04/2012
avg-cpu: %user %nice %system %iowait %steal %idle
14.35 0.00 0.30 0.01 0.00 85.34
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 1.16 4.55 17.22 1520566 5752802
sda1 0.00 0.02 0.00 5074 34
sda2 1.16 4.53 17.22 1515184 5752768
sdb 0.00 0.02 0.00 5108 0
dm-0 2.29 3.88 16.70 1297226 5579336
dm-1 0.00 0.00 0.00 928 0
dm-2 0.11 0.65 0.52 216106 173432
我将数据库迁移到MySQL,这里查询只需要大约0.001秒, 即使对于我所做的所有其他查询,它实际上比sqlite慢(我为sqlite优化,所以这可能会或可能不会令人惊讶)。
答案 0 :(得分:2)
正如我在an answer to a prior question you asked中提到的,你试试过sqlite模块apsw吗? From the website:
APSW是SQLite嵌入式关系数据库的Python包装器 发动机。与pysqlite等其他包装器相比,它着重于 尝试只翻译SQLite是SQLite的最小层 将SQLite API完整到Python中。该文档有一节 APSW和pysqlite之间的区别。
我自己尝试过,似乎确实更好地反映了“真正的”Sqlite(即客户端或C库)如何执行SQL语句。
答案 1 :(得分:0)
SQLite和Python存在性能问题。阅读此主题以获取更多信息。这里有一些建议 - 尝试它们,它可能会起作用 - 比如在连接字段中添加索引或使用pysqlite。
http://www.mail-archive.com/python-list@python.org/msg253067.html