Postgres中的按位操作

时间:2012-02-10 10:23:21

标签: performance postgresql indexing bit-manipulation

我有以下表格:

types | id | name
------+----+----------
         1 | A
         2 | B
         4 | C
         8 | D
         16| E
         32| F

vendors | id | name     | type
--------+----+----------+-----
           1 | Alex     | 2     //type B only
           2 | Bob      | 5     //A,C
           3 | Cheryl   | 32    //F
           4 | David    | 43    //F,D,A,B
           5 | Ed       | 15    //A,B,C,D
           6 | Felix    | 8     //D
           7 | Gopal    | 4     //C
           8 | Herry    | 9     //A,D
           9 | Iris     | 7     //A,B,C
           10| Jack     | 23    //A,B,C,E

我想现在查询:

select id, name from vendors where type & 16 >0 //should return Jack as he is type E
select id, name from vendors where type & 7 >0 //should return Ed, Iris, Jack
select id, name from vendors where type & 8 >0 //should return David, Ed, Felix, Herry 

postgres中表typesvendors的最佳索引是什么?我可能在供应商中有数百万行。此外,与使用第3表的多对多关系相比,使用这种按位方法的权衡是什么?哪个更好?

1 个答案:

答案 0 :(得分:9)

使用可以使用部分索引解决“&”这一事实不是可转换的运算符(afaik):

CREATE INDEX vendors_typeA ON vendors(id) WHERE (type & 2) > 0;
CREATE INDEX vendors_typeB ON vendors(id) WHERE (type & 4) > 0;

当然,每次添加新类型时都需要添加新索引。这是将数据扩展到关联表的原因之一,然后可以对其进行正确索引。您总是可以编写触发器来另外维护一个位掩码表,但是使用多对多表来实际维护数据,因为它会更加清晰。

如果您对扩展和性能的整体评估是说“我可能有数百万行”,那么您还没有做足够的事情来开始进行这种优化。首先创建一个结构合理的清晰模型,然后根据其执行情况的实际统计数据对其进行优化。