如果类型转换失败,则删除行

时间:2014-04-23 23:33:24

标签: sql postgresql exception-handling plpgsql uuid

好的,这是布局:
我有一堆uuid格式的varchar数据。我知道uuid是它自己的类型。这就是我获取数据的方式。因此,要验证哪些是uuid,我会在uuid类型中使用varchar并将其插入到列为uuid的表中。如果插入失败,则它不是uuid类型。我的基本问题是如果插入失败,如何删除错误的uuid。或者,如果插入在另一个表中失败,如何从一个表中删除 我的第一组数据:

drop table if exists temp1;
drop sequence if exists temp1_id_seq;
CREATE temp table temp1 (id serial, some_value varchar);
INSERT INTO temp1(some_value) 
SELECT split_part(name,':',2) FROM branding_resource WHERE name LIKE '%curric%';
create temp table temp2 (id serial, other_value uuid);

CREATE OR REPLACE function verify_uuid() returns varchar AS $$
DECLARE uu RECORD;
BEGIN
FOR uu IN  select * from temp1 
LOOP
    EXECUTE 'INSERT INTO temp2 values ('||uu.id||','''|| uu.some_value||''')';
END LOOP;
END;
$$
LANGUAGE 'plpgsql' ;
select verify_uuid();

当我运行时,我收到错误

  

错误:uuid的输入语法无效:

这是我的期望。我的数据集中有一些不好的uuids。

我的研究让我在文档中Trapping Errors - Exceptions with UPDATE/INSERT 缩小到重要部分:

BEGIN
FOR uu IN  select * from temp1 
LOOP
    begin
    EXECUTE 'INSERT INTO temp2 values ('||uu.id||','''|| uu.some_value||''')';
    return;
    exception when ??? then delete from temp1 where some_value = uu.some_value;
    end;
END LOOP;
END;

我不知道要放什么而不是???。我认为这与ERROR: invalid input syntax for uuid:有关,但我不确定。我实际上不确定这是否是正确的方法呢?

2 个答案:

答案 0 :(得分:2)

您可以使用psql模式从VERBOSE获取SQLSTATE代码,例如:

regress=> \set VERBOSITY verbose
regress=> SELECT 'fred'::uuid;
ERROR:  22P02: invalid input syntax for uuid: "fred"
LINE 1: SELECT 'fred'::uuid;
               ^
LOCATION:  string_to_uuid, uuid.c:129

我们可以看到SQLSTATE22P02。您可以直接在exception子句中使用它,但look it up in the manual通常更易于查找文本表示。在这里,我们看到22P02invalid_text_representation

所以你可以写exception when invalid_text_representation then ...

答案 1 :(得分:1)

@Craig显示了识别SQLSTATE的方法 您还可以使用pgAdmin,默认显示SQLSTATE

SELECT some_value::uuid FROM temp1

> ERROR: invalid input syntax for uuid: "-a0eebc999c0b4ef8bb6d6bb9bd380a11"
> SQL state: 22P02

我将解决更大的问题:

  

我实际上不确定这是否是正确的解决方法?

您的基本方法是正确的方法:'parking in new york' methodquoting Merlin Moncure in this thread on pgsql-general)。但这个程序不必要地昂贵。可能要快得多:

排除明显违反字符串的行为。

你应该能够通过更便宜的正则表达式测试来消除大部分违反字符串的行为。
Postgres accepts a couple of different formats for UUID in text representation,但据我所知,此字符类应涵盖所有有效字符:

'[^A-Fa-f0-9{}-]'

您可以根据您的特定品牌的UUID表示进一步缩小范围(仅限小写?没有花括号?没有连字符?)。

CREATE TEMP TABLE temp1 (id serial, some_value text);

INSERT INTO temp1 (some_value) 
SELECT split_part(name,':',2)
FROM   branding_resource
WHERE  name LIKE '%curric%'
AND    split_part(name,':',2) !~ '[^A-Fa-f0-9{}-]';

“不包含非法字符。”

施放以测试其余部分

而不是填写另一个表,删除(现在很少的!)违反行应该便宜得多:

CREATE OR REPLACE function f_kill_bad_uuid()
  RETURNS void AS
$func$
DECLARE
   rec record;
BEGIN
FOR rec IN
   SELECT * FROM temp1 
LOOP
   BEGIN
   PERFORM rec.some_value::uuid;             -- no dynamic SQL needed
                                             -- do not RETURN! Keep looping.
   RAISE NOTICE 'Good: %', rec.some_value;   -- only for demo
   EXCEPTION WHEN invalid_text_representation THEN
      RAISE NOTICE 'Bad: %', rec.some_value; -- only for demo
      DELETE FROM temp1 WHERE some_value = rec.some_value;
   END;
END LOOP;
END
$func$ LANGUAGE plpgsql;
  • 不需要动态SQL。只需施放。使用PERFORM,因为我们对结果不感兴趣。我们只想看看演员是否通过。

  • 不返回值。您可以计算并返回排除行数...

  • 对于一次性操作,您还可以使用DO声明。

  • 并且不要引用语言名称'plpgsql'。它是一个标识符,而不是字符串。

SQL Fiddle.