好的,这是布局:
我有一堆uuid
格式的varchar
数据。我知道uuid
是它自己的类型。这就是我获取数据的方式。因此,要验证哪些是uuid
,我会在uuid
类型中使用varchar
并将其插入到列为uuid
的表中。如果插入失败,则它不是uuid
类型。我的基本问题是如果插入失败,如何删除错误的uuid
。或者,如果插入在另一个表中失败,如何从一个表中删除
我的第一组数据:
drop table if exists temp1;
drop sequence if exists temp1_id_seq;
CREATE temp table temp1 (id serial, some_value varchar);
INSERT INTO temp1(some_value)
SELECT split_part(name,':',2) FROM branding_resource WHERE name LIKE '%curric%';
create temp table temp2 (id serial, other_value uuid);
CREATE OR REPLACE function verify_uuid() returns varchar AS $$
DECLARE uu RECORD;
BEGIN
FOR uu IN select * from temp1
LOOP
EXECUTE 'INSERT INTO temp2 values ('||uu.id||','''|| uu.some_value||''')';
END LOOP;
END;
$$
LANGUAGE 'plpgsql' ;
select verify_uuid();
当我运行时,我收到错误
错误:uuid的输入语法无效:
这是我的期望。我的数据集中有一些不好的uuids。
我的研究让我在文档中Trapping Errors - Exceptions with UPDATE
/INSERT
缩小到重要部分:
BEGIN
FOR uu IN select * from temp1
LOOP
begin
EXECUTE 'INSERT INTO temp2 values ('||uu.id||','''|| uu.some_value||''')';
return;
exception when ??? then delete from temp1 where some_value = uu.some_value;
end;
END LOOP;
END;
我不知道要放什么而不是???
。我认为这与ERROR: invalid input syntax for uuid:
有关,但我不确定。我实际上不确定这是否是正确的方法呢?
答案 0 :(得分:2)
您可以使用psql
模式从VERBOSE
获取SQLSTATE代码,例如:
regress=> \set VERBOSITY verbose
regress=> SELECT 'fred'::uuid;
ERROR: 22P02: invalid input syntax for uuid: "fred"
LINE 1: SELECT 'fred'::uuid;
^
LOCATION: string_to_uuid, uuid.c:129
我们可以看到SQLSTATE
是22P02
。您可以直接在exception子句中使用它,但look it up in the manual通常更易于查找文本表示。在这里,我们看到22P02
是invalid_text_representation
。
所以你可以写exception when invalid_text_representation then
...
答案 1 :(得分:1)
@Craig显示了识别SQLSTATE
的方法
您还可以使用pgAdmin,默认显示SQLSTATE
:
SELECT some_value::uuid FROM temp1
> ERROR: invalid input syntax for uuid: "-a0eebc999c0b4ef8bb6d6bb9bd380a11"
> SQL state: 22P02
我将解决更大的问题:
我实际上不确定这是否是正确的解决方法?
您的基本方法是正确的方法:'parking in new york' method
(quoting Merlin Moncure in this thread on pgsql-general)。但这个程序不必要地昂贵。可能要快得多:
你应该能够通过更便宜的正则表达式测试来消除大部分违反字符串的行为。
Postgres accepts a couple of different formats for UUID in text
representation,但据我所知,此字符类应涵盖所有有效字符:
'[^A-Fa-f0-9{}-]'
您可以根据您的特定品牌的UUID表示进一步缩小范围(仅限小写?没有花括号?没有连字符?)。
CREATE TEMP TABLE temp1 (id serial, some_value text);
INSERT INTO temp1 (some_value)
SELECT split_part(name,':',2)
FROM branding_resource
WHERE name LIKE '%curric%'
AND split_part(name,':',2) !~ '[^A-Fa-f0-9{}-]';
“不包含非法字符。”
而不是填写另一个表,删除(现在很少的!)违反行应该便宜得多:
CREATE OR REPLACE function f_kill_bad_uuid()
RETURNS void AS
$func$
DECLARE
rec record;
BEGIN
FOR rec IN
SELECT * FROM temp1
LOOP
BEGIN
PERFORM rec.some_value::uuid; -- no dynamic SQL needed
-- do not RETURN! Keep looping.
RAISE NOTICE 'Good: %', rec.some_value; -- only for demo
EXCEPTION WHEN invalid_text_representation THEN
RAISE NOTICE 'Bad: %', rec.some_value; -- only for demo
DELETE FROM temp1 WHERE some_value = rec.some_value;
END;
END LOOP;
END
$func$ LANGUAGE plpgsql;