tsvector更新中的Postgresql正则表达式

时间:2012-12-06 11:27:03

标签: sql postgresql triggers postgresql-9.0 tsvector

我有一个tsvector列的以下更新触发器

CREATE TRIGGER tsvector_user_update
BEFORE INSERT OR UPDATE ON users
FOR EACH ROW EXECUTE PROCEDURE 
tsvector_update_trigger(user_tsv, 'pg_catalog.english', firstname, surname, email, card_id);

这样可以正常工作,但是我的card_id列(文本)包含一个用户不知道的前导(它是在扫描卡后添加的),因此我想删除前导码时生成了tsvector值,我尝试了触发函数作为开始

CREATE FUNCTION user_change_trigger() RETURNS trigger AS $$
BEGIN
NEW.user_tsv = setweight(to_tsvector('pg_catalog.english', coalesce(NEW.firstname,'')), 'A') ||
    setweight(to_tsvector('pg_catalog.english', coalesce(NEW.surname,'')), 'A') ||
    setweight(to_tsvector('pg_catalog.english', coalesce(REGEXP_REPLACE(NEW.card_id, '^\d+PRE', ''),'')), 'B') ||
    setweight(to_tsvector('pg_catalog.english', coalesce(NEW.email,'')), 'C');
    return new;
END

$$ LANGUAGE plpgsql;

CREATE TRIGGER tsvectorupdate BEFORE INSERT OR UPDATE
ON users FOR EACH ROW EXECUTE PROCEDURE user_change_trigger();

执行哪个,但我得到以下内容:

WARNING:  nonstandard use of escape in a string literal

没有更新的tsvector

pre-amble是一个整数,后跟'PRE'。

(PostgreSQL 9.0)

1 个答案:

答案 0 :(得分:3)

基本触发器设计

问题属于本质问题。在PostgreSQL中,您可以创建一个触发器函数来完成工作。我没有在问题中看到你的触发功能。

然后创建一个触发器,它使用此功能。您只能将常量传递给触发器功能。请考虑the manual about CREATE TRIGGER

中的这句话
  

函数名

     

用户提供的函数,声明为不带参数和   返回类型触发器,在触发器触发时执行。

     

参数

     

要提供给的可选逗号分隔的参数列表   执行触发器时的功能。 参数是文字的   字符串常量。可以编写简单的名称和数字常量   这里也是,但它们都将被转换为字符串。请检查   触发函数的实现语言的描述   找出如何在函数中访问这些参数;它   可能与普通函数参数不同。

大胆强调我的。

使用NEW访问触发器功能中的列值。您不需要将它们作为参数传递。首先掌握基本概念。 Start here.

regexp_replace()

使用:

regexp_replace(card_id, '^\d+PRE', '')

..因为前导字符应该只是数字(至少是其中一个)。

正确触发&功能

以下测试用例在PostgreSQL 9.1.6上适用于我。你的版本看起来对我很好,我只做了一些小改动。但继续阅读...

创建测试环境(将在最后回滚):

BEGIN;
CREATE SCHEMA test;
SET search_path = test;

CREATE TABLE users (
    users_id serial primary key
   ,firstname text
   ,surname text
   ,card_id text
   ,email text
   ,user_tsv tsvector
   );

触发功能:

CREATE FUNCTION user_change_trigger()
  RETURNS trigger AS
$func$
BEGIN

NEW.user_tsv :=
   setweight(to_tsvector('pg_catalog.english', coalesce(NEW.firstname,'')), 'A')
|| setweight(to_tsvector('pg_catalog.english', coalesce(NEW.surname,'')), 'A')
|| setweight(to_tsvector('pg_catalog.english', coalesce(regexp_replace(NEW.card_id, '^\d+PRE', ''),'')), 'B')
|| setweight(to_tsvector('pg_catalog.english', coalesce(NEW.email,'')), 'C');

RETURN NEW;
END

$func$ LANGUAGE plpgsql;

assignment operator of plpgsql is := - 与使用=的SQL不同。

触发:

CREATE TRIGGER tsvectorupdate
BEFORE INSERT OR UPDATE ON users
FOR EACH ROW EXECUTE PROCEDURE user_change_trigger();

试验:

INSERT INTO users (firstname, surname, card_id, email)
VALUES ('Erwin', 'Brandstetter', '123PRE456', 'foo@dummy.org')
RETURNING *;

-- looks good!

UPDATE users SET firstname = 'Walter' WHERE TRUE
RETURNING *;

-- looks good, too!

清理:

ROLLBACK;

standard_conforming_strings

探索standard_conforming_strings的设置。警告表明您没有启用此设置,这需要您将反斜杠加倍:

'^\\d+PRE'