我使用这样的架构创建一个表:
CREATE TABLE wordIndex(id integer primary key, word varchar(128), offset integer, length integer);
CREATE INDEX word_idx on wordIndex(word);
现在该表有大约450,000行记录。当我在ipod4上使用Like语句时,性能不佳: 从wordIndex中选择*,其中的单词如'test acces%'; 使用解释输出:
explain select * from wordIndex where word like 'test acces%';
0|Trace|0|0|0||00|
1|Goto|0|16|0||00|
2|OpenRead|0|2|0|4|00|
3|Rewind|0|14|0||00|
4|String8|0|2|0|test acces%|00|
5|Column|0|1|3||00|
6|Function|1|2|1|like(2)|02|
7|IfNot|1|13|1||00|
8|Rowid|0|4|0||00|
9|Column|0|1|5||00|
10|Column|0|2|6||00|
11|Column|0|3|7||00|
12|ResultRow|4|4|0||00|
13|Next|0|4|0||01|
14|Close|0|0|0||00|
15|Halt|0|0|0||00|
16|Transaction|0|0|0||00|
17|VerifyCookie|0|2|0||00|
18|TableLock|0|2|0|wordIndex|00|
19|Goto|0|2|0||00|
可能是我需要构建一个额外的倒排索引来提高性能还是......? 谢谢你!
答案 0 :(得分:13)
索引和like
在大多数数据库中都不相处。最好的办法是尽可能将查询重写为范围查询,因为将使用索引:
select *
from wordIndex
where word between 'test acces' and 'test acces{'
(开括号是紧跟在'z'之后的ASCII字符。)
如果您在单词的开头寻找模式(比如说'%test'),那么您可能不得不让自己重新进行全表扫描。
编辑:
当模式以常量开头时,索引和like
* do`现在在大多数数据库中相处,所以你可以这样做:
select *
from wordIndex
where word like 'test acces%' ;
但是,我对SQLite并不是百分之百确定,所以请检查执行计划,看看它是否使用了索引。
答案 1 :(得分:5)
试试这个:
SELECT * FROM wordIndex
WHERE word COLLATE NOCASE BETWEEN @SearchString AND @SearchString || '~~~~~~~~~~'
“〜”是最大的ASCII符号。
答案 2 :(得分:2)
与Gordon Linoff相比,我的回答略有不同,但采用相同的方法。
如果你想保留“测试访问”后面的任何字符,你应该试试这个:
SELECT * FROM wordIndex
WHERE word > 'test acces' AND word < 'test accet';