数组搜索不使用索引

时间:2014-11-08 23:24:56

标签: postgresql indexing plpgsql postgresql-9.2

我有一个带有下表的Postgres 9.2服务器:

A,其中包含一列code和一个B树索引:

db=> \d A
Table "public.A"
Column  |  Type  | Modifiers 
--------+--------+-----------
 code   | bigint | not null

 Indexes:
 "A_pkey" PRIMARY KEY, btree (code)

我有一个简单的PLPGSQL函数如下,为了便于遵循而简化:

create or replace function list (bigint)
   RETURNS bigint[] AS '
    DECLARE
            arr        bigint[];
            c          ALIAS FOR $1;
    begin
            arr[0] = c * 1;
            arr[1] = c * 2;
            ...
            ...
            arr[10] = c * 1024;
            return arr;
END;
' language plpgsql;

我注意到在调用函数时不使用索引:

db => explain select * from A where code = ANY(list(3234234234));
                           QUERY PLAN                               
------------------------------------------------------------------------
Seq Scan on A (cost=0.00..1440291398.32 rows=10 width=219)
Filter: (code = ANY (list(3234234234::bigint)))

即使我将函数的输出强制转换为ANY(list(3234234234) :: bigint[])

,也没有运气

当然,如果我手动创建一个列表,它就能完美运行。

db=> explain select * from A where code = ANY( '{21312,13123,1312312,1231312,123213231}' :: bigint[]); 
                                   QUERY PLAN                                       
----------------------------------------------------------------------------------------
Bitmap Heap Scan on A  (cost=538.09..558.17 rows=5 width=219)
Recheck Cond: (code = ANY ('{21312,13123,1312312,1231312,123213231}'::bigint[]))
    ->  Bitmap Index Scan on A_pkey  (cost=0.00..538.09 rows=5 width=0)
        Index Cond: (code = ANY ('{21312,13123,1312312,1231312,123213231}'::bigint[]))

为什么Postgres在使用该功能时会进行顺序扫描?
如何使用该函数进行索引扫描?

1 个答案:

答案 0 :(得分:0)

为什么不使用索引?

该函数返回11个bigint数字,但Postgres并不真正知道,因为PL / pgSQL函数是查询规划器的黑盒,它的{{1}也是。这告诉Postgres期待一个不同的数组永远打电话。 Postgres认为直接使用数组中可能包含大量元素的表格会更便宜。对于具有固定数量的仅5个元素的替代方案,期望是不同的。

改进功能

使用这个简单的VOLATILE SQL函数:

IMMUTABLE

在几个方面更简单,更快,而且更容易使用索引。

  • PL / pgSQL中的许多赋值相对较贵,对于组装长数组更是如此,因为整个数组必须在每次赋值时重写。顺便说一下,PL / pgSQL中的正确赋值运算符是 CREATE OR REPLACE function list (c bigint) RETURNS bigint[] LANGUAGE sql IMMUTABLE AS 'SELECT array_agg($1 * (2^g)::int) FROM generate_series(0, 10) g'; 而不是:=

  • 默认函数波动率为=。您的函数可以是VOLATILE:始终保证相同输入的相同输出。可以帮助优化重复呼叫。

  • 您的整个语法已经过时,您根本不需要PL / pgSQL。可以在外部查询的上下文中内联简单的SQL函数。

  • 最后,对于嵌套在较大查询环境中的函数,PL / pgSQL并不总是一个不错的选择。它们是查询规划器的黑盒子,并充当优化障碍。详细说明:

SQL Fiddle.

Postgres数组索引默认以1开头。如果你真的需要你的数组以索引0 开头,你可以使用相关答案中的技巧来改变它(但我不希望你需要它):