我有两个SQLite表(list1
和list2
),每个表只有一个文本列(val
)。我想有效地搜索所有组合,其中list2.value
可以是list1.value
中的子字符串。
目前我有以下解决方案:
import sqlite3
list1 = ["this is string1", "this is string2", "this is string3"]
list2 = ["string1", "string2"]
in_memory = sqlite3.connect(':memory:')
c = in_memory.cursor()
c.execute('CREATE TABLE list1 (val text NOT NULL)')
c.execute('CREATE TABLE list2 (val text NOT NULL)')
for v in list1:
c.execute("INSERT INTO list1 VALUES (?)", (v, ))
for v in list2:
c.execute("INSERT INTO list2 VALUES (?)", (v, ))
l = [*c.execute("SELECT list1.val, list2.val FROM list1, list2 WHERE instr(list1.val, list2.val)")]
print(l)
正确打印:
[('this is string1', 'string1'), ('this is string2', 'string2')]
是否有比迭代每个list1.val
和list2.val
组合并搜索是否有子字符串更有效的SQL解决方案?
答案 0 :(得分:2)
您可以将其作为单个查询来表达:
select l1.value, l2.value
from list1 l1 join
list2 l2
on l1.val like '%' || l2.val || '%';
在数据库内部执行循环要比自己执行循环效率更高-因为只返回匹配的行,并且没有多个查询的开销。
但是,这仍然会执行嵌套循环。这样的查询无法利用传统索引。