不使用plpgsql,我试图在pgsql SELECT语句中对给定文本进行urlencode。
这种方法的问题:
select regexp_replace('héllo there','([^A-Za-z0-9])','%' || encode(E'\\1','hex'),'g')
...是编码函数没有传递regexp参数,除非有另一种方法从实际工作的替换表达式中调用函数。所以我想知道是否有一个替换表达式,它本身可以将匹配编码为十六进制值。
可能还有其他功能组合。我以为会有一个聪明的正则表达式(可能仍然是答案),但我找不到它。
答案 0 :(得分:6)
select regexp_replace(encode('héllo there','hex'),'(..)',E'%\\1','g');
但这并不会使字母数字字符具有人类可读性。
答案 1 :(得分:1)
这是我编写的一个函数,它使用内置函数处理编码,同时保留URL的可读性。
正则表达式匹配以捕获(可选)安全字符对和(最多一个)非安全字符对。嵌套选择允许对这些对进行编码和重新组合,返回完全编码的字符串。
我经历了一个具有各种排列的测试套件(前导/尾随/仅/重复编码的字符,到目前为止它似乎正确编码。
安全的特殊字符是_~。 - 和/。我在该列表中包含“/”可能是非标准的,但适合我在输入文本可能是路径的用例,我希望保留它。
CREATE OR REPLACE FUNCTION oseberg.encode_uri(input text)
RETURNS text
LANGUAGE plpgsql
IMMUTABLE STRICT
AS $function$
DECLARE
parsed text;
safePattern text;
BEGIN
safePattern = 'a-zA-Z0-9_~/\-\.';
IF input ~ ('[^' || safePattern || ']') THEN
SELECT STRING_AGG(fragment, '')
INTO parsed
FROM (
SELECT prefix || encoded AS fragment
FROM (
SELECT COALESCE(match[1], '') AS prefix,
COALESCE('%' || encode(match[2]::bytea, 'hex'), '') AS encoded
FROM (
SELECT regexp_matches(
input,
'([' || safePattern || ']*)([^' || safePattern || '])?',
'g') AS match
) matches
) parsed
) fragments;
RETURN parsed;
ELSE
RETURN input;
END IF;
END;
$function$
答案 2 :(得分:1)
这是非常简短的版本,它甚至是纯粹的SQL"功能,而不是plpgsql。支持多字节字符(包括3字节和4字节表情符号)。
create or replace function urlencode(in_str text, OUT _result text) returns text as $$
select
string_agg(
case
when ol>1 or ch !~ '[0-9a-za-z:/@._?#-]+'
then regexp_replace(upper(substring(ch::bytea::text, 3)), '(..)', E'%\\1', 'g')
else ch
end,
''
)
from (
select ch, octet_length(ch) as ol
from regexp_split_to_table($1, '') as ch
) as s;
$$ language sql immutable strict;
答案 3 :(得分:-3)
您可以使用CLR并导入命名空间或使用此链接中显示的函数,这将创建一个执行编码的T-SQL函数。
http://www.sqljunkies.com/WebLog/peter_debetta/archive/2007/03/09/28987.aspx