沿着分层表中的路径(节点数组)查找第一个非空值

时间:2012-06-13 08:35:26

标签: arrays postgresql hierarchy plpgsql postgresql-9.1

我一直在努力尝试几个小时来创建一个函数,根据下标数组的条件过滤数组下标,然后创建这些下标的数组。

我正在处理的数据结构类似于以下示例(除了要比较更多的列以及更复杂的规则和混合数据类型):

id hierarchy abbreviation1 abbreviation2
1  {1}       SB            GL
2  {2,1}     NULL          NULL
3  {3,2,1}   NULL          TC
4  {4,2,1}   NULL          NULL

我需要运行一个查询,该查询将最接近父项的下一个非空值用于abbreviation1和abbreviation2,并根据与当前记录的层次结构距离对它们进行比较,以获得缩写的单个值。因此,例如,如果abbreviation1和abbreviation2的第一个非null值都在同一记录级别上,则abbreviation1将优先;另一方面,如果第一个非null缩写2更接近当前记录,则使用abbreviation1的相应非空值,然后使用缩写2。

因此,上述样本表中描述的查询将产生;

id abbreviation
1  SB
2  SB
3  TC
4  SB

要完成此任务,我需要生成一个过滤的数组下标数组(在缩写列上执行array_agg()之后),该数组只包含缩写列中的值不为null的下标。

基于我疲惫的头脑中的所有逻辑,以下功能应该有效,但不是

CREATE OR REPLACE FUNCTION filter_array_subscripts(rawarray anyarray,criteria anynonarray,dimension integer, reverse boolean DEFAULT False) 
  RETURNS integer[] as 
$$
DECLARE
  outarray integer[] := ARRAY[]::integer[];
  x integer;
  BEGIN
    for i in array_lower(rawarray,dimension)..array_upper(rawarray,dimension) LOOP
      IF NOT criteria IS NULL THEN
        IF NOT rawarray[i] IS NULL THEN
          IF NOT rawarray[i] = criteria THEN
            IF reverse = False THEN
              outarray := array_append(outarray,i);
            ELSE
              outarray := array_prepend(i,outarray);
            END IF;
         ELSE
            IF reverse = False THEN
              outarray := array_append(outarray,i);
            ELSE
              outarray := array_prepend(i,outarray);
            END IF;
         END IF;
        END IF;
      ELSE
        IF NOT rawarray[i] is NULL THEN
          IF reverse = False THEN
            outarray := array_append(outarray,i);
          ELSE
            outarray := array_prepend(i,outarray);
          END IF;
        END IF;
      END IF;
    END LOOP;
    RETURN outarray;
  END; 
$$ LANGUAGE plpgsql;

例如,以下查询在返回{5,3,1}

时会返回{5,4,2,1}
select filter_array_subscripts(array['This',NULL,'is',NULL,'insane!']::text[]
                               ,'is',1,True);

我不知道为什么这不起作用,我尝试使用foreach数组迭代语法,但我无法弄清楚如何将迭代值转换为anyarray中包含的标量类型。

可以采取哪些措施来解决这个问题?

1 个答案:

答案 0 :(得分:2)

使用PostgreSQL 8.4或更高版本中提供的RECURSIVE CTE可以大大简化整个过程:

测试表(让每个人都可以更轻松地以 this 的形式提供测试数据):

CREATE TEMP TABLE tbl (
    id int
  , hierarchy int[]
  , abbreviation1 text
  , abbreviation2 text
);

INSERT INTO tbl VALUES
 (1, '{1}',     'SB', 'GL')
,(2, '{2,1}',   NULL, NULL)
,(3, '{3,2,1}', NULL, 'TC')
,(4, '{4,2,1}', NULL, NULL);

查询:

WITH RECURSIVE x AS (
    SELECT id
         , COALESCE(abbreviation1, abbreviation2) AS abbr
         , hierarchy[2] AS parent_id
    FROM   tbl

    UNION ALL
    SELECT x.id
         , COALESCE(parent.abbreviation1, parent.abbreviation2) AS abbr
         , parent.hierarchy[2] AS parent_id
    FROM   x
    JOIN   tbl AS parent ON parent.id = x.parent_id
    WHERE  x.abbr IS NULL  -- stop at non-NULL value
    )
SELECT id, abbr
FROM   x
WHERE  abbr IS NOT NULL  -- discard intermediary NULLs
ORDER  BY id

返回:

id | abbr
---+-----
1  | SB
2  | SB
3  | TC
4  | SB

这假定每条路径都有一个非空值,或者从结果中删除这些行。