Sqlite视图与普通的select语句性能

时间:2012-05-07 15:03:52

标签: performance sqlite select

我在SQLite数据库中有一个简单的表(大约有8列和很多行)。有一个程序作为服务运行,并且经常在表上执行选择,更新和插入(大约每5分钟一次)。选择仅用于确定要更新哪些行,它们基于保存布尔值的列(可能由SQLite在内部转换为整数)。

当Web用户希望查看部分数据时,还有一个Web应用程序执行选择(始终使用GROUP BY子句)。

通过Web应用程序请求数据的方法有两种:(a)预定义过滤器(即where子句在3个特定列上具有特定条件)和(b)自定义过滤器(即用户选择条件的值) ,但参与where子句的列与(a)中的相同。如上所述,在这两种情况下都有GROUP BY操作。

我想知道使用视图或自定义函数是否会提高性能。目前,“自定义”选择可能需要30秒以上才能完成 - 这是在将任何数据发送回用户之前。

编辑: 在“预定义”选择语句上使用EXPLAIN QUERY PLAN只产生一行:

0|0|TABLE mytable

在同一查询中使用EXPLAIN,产生以下结果:

0|OpenVirtual|1|4|keyinfo(2,-BINARY,BINARY)
1|OpenVirtual|2|3|keyinfo(1,BINARY)
2|MemInt|0|5|
3|MemInt|0|4|
4|Goto|0|27|
5|MemInt|1|5|
6|Return|0|0|
7|IfMemPos|4|9|
8|Return|0|0|
9|AggFinal|0|0|count(0)
10|AggFinal|2|1|sum(1)
11|MemLoad|0|0|
12|MemLoad|1|0|
13|MemLoad|2|0|
14|MakeRecord|3|0|
15|MemLoad|0|0|
16|MemLoad|1|0|
17|Sequence|1|0|
18|Pull|3|0|
19|MakeRecord|4|0|
20|IdxInsert|1|0|
21|Return|0|0|
22|MemNull|1|0|
23|MemNull|3|0|
24|MemNull|0|0|
25|MemNull|2|0|
26|Return|0|0|
27|Gosub|0|22|
28|Goto|0|82|
29|Integer|0|0|
30|OpenRead|0|2|
31|SetNumColumns|0|9|
32|Rewind|0|48|
33|Column|0|8|
34|String8|0|0|123456789
35|Le|356|39|collseq(BINARY)
36|Column|0|3|
37|Integer|180|0|
38|Gt|100|42|collseq(BINARY)
39|Column|0|7|
40|Integer|1|0|
41|Ne|356|47|collseq(BINARY)
42|Column|0|6|
43|Sequence|2|0|
44|Column|0|3|
45|MakeRecord|3|0|
46|IdxInsert|2|0|
47|Next|0|33|
48|Close|0|0|
49|Sort|2|69|
50|Column|2|0|
51|MemStore|7|0|
52|MemLoad|6|0|
53|Eq|512|58|collseq(BINARY)
54|MemMove|6|7|
55|Gosub|0|7|
56|IfMemPos|5|69|
57|Gosub|0|22|
58|AggStep|0|0|count(0)
59|Column|2|2|
60|Integer|30|0|
61|Add|0|0|
62|ToReal|0|0|
63|AggStep|2|1|sum(1)
64|Column|2|0|
65|MemStore|1|1|
66|MemInt|1|4|
67|Next|2|50|
68|Gosub|0|7|
69|OpenPseudo|3|0|
70|SetNumColumns|3|3|
71|Sort|1|80|
72|Integer|1|0|
73|Column|1|3|
74|Insert|3|0|
75|Column|3|0|
76|Column|3|1|
77|Column|3|2|
78|Callback|3|0|
79|Next|1|72|
80|Close|3|0|
81|Halt|0|0|
82|Transaction|0|0|
83|VerifyCookie|0|1|
84|Goto|0|29|
85|Noop|0|0|

我使用的选择如下:

SELECT 
    COUNT(*) as number, 
    field1, 
    SUM(CAST(filter2 +30 AS float)) as column2 
FROM 
    mytable 
WHERE 
    (filter1 > '123456789'  AND filter2 > 180) 
    OR filter3=1 
GROUP BY 
    field1 
ORDER BY 
    number DESC, field1;

1 个答案:

答案 0 :(得分:1)

每当你要对非主键字段进行比较时,add an index进入字段是一个很好的设计理念。但是,太多可能会导致INSERT抓取,因此请进行相应的计划。

此外,如果您有简单的字段,例如只包含布尔值的字段,您可能需要考虑将其声明为INTEGER而不是您声明的任何字段。将其声明为SQLite未明确定义的任何类型将cause it to default to a NUMERIC type,这将需要更长的时间来比较值,因为它将在内部将其存储为double并将使用浮点数学处理器而不是整数数学处理器。

IMO,GROUP BY排序指令有时候是对未经优化的查询的假设;它的方法涉及消除冗余数据,如果数据没有从数据库中拉出来,可以事先将其删除。

编辑:

我看到了你的查询,看到你可以做一些简单的事情来优化它:

  • SUM(CAST(filter2 +30 AS float))效率低下;你为什么要把它当作浮子?为什么不只是SUM然后添加30 * COUNT

  • filter1 > '123456789' - 为什么要进行字符串比较?为什么不直接使用整数比较?