我有以下表格:
types | id | name
------+----+----------
1 | A
2 | B
4 | C
8 | D
16| E
32| F
和
vendors | id | name | type
--------+----+----------+-----
1 | Alex | 2 //type B only
2 | Bob | 5 //A,C
3 | Cheryl | 32 //F
4 | David | 43 //F,D,A,B
5 | Ed | 15 //A,B,C,D
6 | Felix | 8 //D
7 | Gopal | 4 //C
8 | Herry | 9 //A,D
9 | Iris | 7 //A,B,C
10| Jack | 23 //A,B,C,E
我想现在查询:
select id, name from vendors where type & 16 >0 //should return Jack as he is type E
select id, name from vendors where type & 7 >0 //should return Ed, Iris, Jack
select id, name from vendors where type & 8 >0 //should return David, Ed, Felix, Herry
postgres中表types
和vendors
的最佳索引是什么?我可能在供应商中有数百万行。此外,与使用第3表的多对多关系相比,使用这种按位方法的权衡是什么?哪个更好?
答案 0 :(得分:9)
使用可以使用部分索引解决“&”这一事实不是可转换的运算符(afaik):
CREATE INDEX vendors_typeA ON vendors(id) WHERE (type & 2) > 0;
CREATE INDEX vendors_typeB ON vendors(id) WHERE (type & 4) > 0;
当然,每次添加新类型时都需要添加新索引。这是将数据扩展到关联表的原因之一,然后可以对其进行正确索引。您总是可以编写触发器来另外维护一个位掩码表,但是使用多对多表来实际维护数据,因为它会更加清晰。
如果您对扩展和性能的整体评估是说“我可能有数百万行”,那么您还没有做足够的事情来开始进行这种优化。首先创建一个结构合理的清晰模型,然后根据其执行情况的实际统计数据对其进行优化。