我正在尝试创建一个函数,该函数将表和可变数量的列作为参数,然后返回一个没有行的表,这些行在所有这些列上都有重复项。我试图弄清楚如何将可变数量的列作为参数,我已经收集到我可能需要一个VARIADIC
参数,但我不确定如何实现它。到目前为止我所拥有的:
CREATE FUNCTION remove_duplicates(orig_table, VARIADIC sel_columns column)
RETURNS table AS $$
SELECT * FROM
(SELECT *,
count(*) over (partition by sel_columns) AS count
FROM orig_table)
WHERE count = 1;
$$ LANGUAGE SQL;
举个例子,如果我有一个这样的表:
cola | colb | colc
-------------------
a | b | 1
a | b | 2
a | c | 3
a | d | 4
我想运行SELECT * FROM remove_duplicates(mytable, cola, colb)
并获得此结果:
cola | colb | colc
-------------------
a | c | 3
a | d | 4
感谢您的帮助。我正在使用postgresql 9.4.9
答案 0 :(得分:2)
您无法通过简单的SQL函数获得所需内容,您需要使用过程语言的强大功能。可能的解决方案是:
CREATE OR REPLACE FUNCTION remove_duplicates(orig_table anyelement, VARIADIC sel_columns text[])
RETURNS SETOF anyelement AS $$
DECLARE
orig_table_columns TEXT;
BEGIN
SELECT array_to_string(array_agg(quote_ident(column_name)),',') INTO orig_table_columns FROM information_schema.columns WHERE table_name = CAST(pg_typeof(orig_table) AS TEXT);
RETURN QUERY EXECUTE 'SELECT ' || orig_table_columns || ' FROM '
|| '(SELECT *, '
|| ' count(*) over (partition by ' || array_to_string(sel_columns, ',') || ') AS count '
|| 'FROM ' || pg_typeof(orig_table) || ') AS tmp '
|| ' WHERE count = 1 ';
END
$$ LANGUAGE PLPGSQL;
SELECT * FROM remove_duplicates(NULL::tests, 'cola', 'colb');
请勿忘记进行更改以避免SQL注入。
编辑:有关动态返回类型函数的非常好的解释,请参阅Erwin的答案here。