拆分带有两个分隔符的字符串并转换类型

时间:2014-11-26 11:54:05

标签: postgresql plpgsql set-returning-functions

我有一个像这样的PL / pgSQL函数(感谢那个让这成为可能的人):

 CREATE OR REPLACE FUNCTION public.split_string(text, text)
    RETURNS SETOF text
    LANGUAGE plpgsql
    AS $function$
    DECLARE 
      pos int; 
      delim_length int := length($2);
    BEGIN
      WHILE $1 <> ''
      LOOP
        pos := strpos($1,$2);
        IF pos > 0 THEN
          RETURN NEXT substring($1 FROM 1 FOR pos - 1);
          $1 := substring($1 FROM pos + delim_length);
        ELSE
          RETURN NEXT $1;
          EXIT;
        END IF; 
      END LOOP;
      RETURN;
    END;
    $function$

它使用分隔符拆分字符串。像这样:

select * from split_string('3.584731 60.739211,3.590472 60.738030,3.592740 60.736220', ' ');

"3.584731"
"60.739211,3.590472"
"60.738030,3.592740"
"60.736220"

如何将结果保存在temp_array或temp_table中。所以我可以在temp_x中得到结果并再次分割这些点。像:

"3.584731"
"60.739211"
"3.590472"
"60.738030"
"3.592740"
"60.736220"

并将值返回为double precision。所有这些都应该在函数中完成。

3 个答案:

答案 0 :(得分:6)

您不需要特殊功能,请使用built-in regexp_split_to_table

SELECT *
  FROM regexp_split_to_table(
        '3.584731 60.739211,3.590472 60.738030,3.592740 60.736220',
        '[, ]') s;

修改 如果有内置的PL / pgSQL功能,我不明白你为什么要坚持使用PL / pgSQL功能。

无论如何,请考虑这个例子:

WITH s AS
(
    SELECT ' ,'::text sep,
           '3.584731 60.739211,3.590472 60.738030,3.592740 60.736220'::text str
 )
SELECT sep, left(sep,1), right(sep,-1),
       str,
       translate(str, right(sep,-1), left(sep,1))
  FROM s;

这意味着您可以:

  1. 在调用您的函数或
  2. 之前进行类似的转换
  3. 将此代码集成到内部,但这意味着您需要引入至少一个额外变量,除非您觉得在整个代码中将所有$1替换为translate($1, right($2,-1), left($2,1))感觉很舒服。显然,普通$2应更改为left($2,1)

答案 1 :(得分:3)

如果您需要中间步骤:

SELECT unnest(string_to_array(a, ' '))::float8
       -- or do something else with the derived table
FROM   unnest(string_to_array('3.584731 60.739211,3.590472 60.738030', ',')) a;

这比regexp_split_to_table()更冗长,但可能仍然更快,因为正则表达式通常更昂贵。 (使用EXPLAIN ANALYZE进行测试。)

我首先在','处分开,然后在' '处分开 - 您所描述的相反顺序似乎更合适。

如果需要,可以将其包装到PL / pgSQL函数中:

CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
BEGIN
   RETURN QUERY
   SELECT unnest(string_to_array(a, _delim2))::float8
          -- or do something else with the derived table from step 1
   FROM   unnest(string_to_array(_str, _delim1)) a;
END
$func$ LANGUAGE plpgsql IMMUTABLE;

或者只是一个SQL函数:

CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
   SELECT unnest(string_to_array(a, _delim2))::float8
   FROM   unnest(string_to_array(_str, _delim1)) a
$func$ LANGUAGE sql IMMUTABLE;

使其IMMUTABLE以允许性能优化和其他用途。

致电(使用_delim1_delim2提供的默认设置):

SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030');

或者:

SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030', ',', ' ');

最快

要获得最佳效果,请将translate()unnest(string_to_array(...))合并:

SELECT unnest(
          string_to_array(
             translate('3.584731 60.739211,3.590472 60.738030', ' ', ',')
           , ','
          )
       )::float8

答案 2 :(得分:0)

如果我理解你的问题,你可以这样做:

-- store context to temp table
CREATE TEMP TABLE foo AS SELECT v::double precision FROM split_string('...') g(v);

-- store context to ARRAY
SELECT ARRAY(SELECT v::double precision FROM split_string('....') g(v))