我有一个带有下表的Postgres 9.2服务器:
表A
,其中包含一列code
和一个B树索引:
db=> \d A
Table "public.A"
Column | Type | Modifiers
--------+--------+-----------
code | bigint | not null
Indexes:
"A_pkey" PRIMARY KEY, btree (code)
我有一个简单的PLPGSQL函数如下,为了便于遵循而简化:
create or replace function list (bigint)
RETURNS bigint[] AS '
DECLARE
arr bigint[];
c ALIAS FOR $1;
begin
arr[0] = c * 1;
arr[1] = c * 2;
...
...
arr[10] = c * 1024;
return arr;
END;
' language plpgsql;
我注意到在调用函数时不使用索引:
db => explain select * from A where code = ANY(list(3234234234));
QUERY PLAN
------------------------------------------------------------------------
Seq Scan on A (cost=0.00..1440291398.32 rows=10 width=219)
Filter: (code = ANY (list(3234234234::bigint)))
即使我将函数的输出强制转换为ANY(list(3234234234) :: bigint[])
当然,如果我手动创建一个列表,它就能完美运行。
db=> explain select * from A where code = ANY( '{21312,13123,1312312,1231312,123213231}' :: bigint[]);
QUERY PLAN
----------------------------------------------------------------------------------------
Bitmap Heap Scan on A (cost=538.09..558.17 rows=5 width=219)
Recheck Cond: (code = ANY ('{21312,13123,1312312,1231312,123213231}'::bigint[]))
-> Bitmap Index Scan on A_pkey (cost=0.00..538.09 rows=5 width=0)
Index Cond: (code = ANY ('{21312,13123,1312312,1231312,123213231}'::bigint[]))
为什么Postgres在使用该功能时会进行顺序扫描?
如何使用该函数进行索引扫描?
答案 0 :(得分:0)
该函数返回11个bigint数字,但Postgres并不真正知道,因为PL / pgSQL函数是查询规划器的黑盒,它的{{1}也是。这告诉Postgres期待一个不同的数组永远打电话。 Postgres认为直接使用数组中可能包含大量元素的表格会更便宜。对于具有固定数量的仅5个元素的替代方案,期望是不同的。
使用这个简单的VOLATILE
SQL函数:
IMMUTABLE
在几个方面更简单,更快,而且更容易使用索引。
PL / pgSQL中的许多赋值相对较贵,对于组装长数组更是如此,因为整个数组必须在每次赋值时重写。顺便说一下,PL / pgSQL中的正确赋值运算符是 CREATE OR REPLACE function list (c bigint)
RETURNS bigint[] LANGUAGE sql IMMUTABLE AS
'SELECT array_agg($1 * (2^g)::int) FROM generate_series(0, 10) g';
而不是:=
:
默认函数波动率为=
。您的函数可以是VOLATILE
:始终保证相同输入的相同输出。可以帮助优化重复呼叫。
您的整个语法已经过时,您根本不需要PL / pgSQL。可以在外部查询的上下文中内联简单的SQL函数。
最后,对于嵌套在较大查询环境中的函数,PL / pgSQL并不总是一个不错的选择。它们是查询规划器的黑盒子,并充当优化障碍。详细说明:
Postgres数组索引默认以1开头。如果你真的需要你的数组以索引0 开头,你可以使用相关答案中的技巧来改变它(但我不希望你需要它):