PostgreSQL - 返回键值对数组的最佳方法

时间:2012-02-03 14:05:39

标签: sql database postgresql npgsql

我正在尝试选择多个字段,其中一个字段需要是一个数组,其中包含两个值的数组的每个元素。每个数组项都需要包含名称(字符变化)和ID(数字)。我知道如何返回一个单值数组(使用ARRAY关键字),但我不确定如何返回一个对象数组,该数组本身包含两个值。

查询类似于

SELECT
    t.field1,
    t.field2,
    ARRAY(--with each element containing two values i.e. {'TheName', 1 })
FROM MyTable t

我读到一种方法是通过选择一个类型的值,然后创建该类型的数组。问题是,函数的其余部分已经返回一个类型(这意味着我将拥有嵌套类型 - 是吗?如果是这样,你将如何在应用程序代码中读取这些数据 - 即使用像NPGSQL这样的.Net数据提供程序?)

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:11)

ARRAY只能包含相同类型的元素

您的示例显示textinteger值(1周围没有单引号)。通常不可能在数组中混合类型。要将这些值放入数组中,您必须创建一个composite type,然后像您自己提到的那样形成该复合类型的ARRAY。

或者 ,您可以使用Postgres 9.2 +中的数据类型json,Postgres 9.4+中的jsonbhstore键值对。


当然,您可以将integer转换为text,并使用二维文本数组。在下面的演示中考虑数组输入的两种语法变体,并参考the manual on array input

有一个限制需要克服。如果您尝试将ARRAY(从键和值构建)聚合为二维数组,则聚合函数array_agg()ARRAY构造函数会出错:

ERROR:  could not find array type for data type text[]

但是有很多方法可以解决这个问题。

将键值对聚合成二维数组

带有standard_conforming_strings= on的PostgreSQL 9.1:

CREATE TEMP TABLE tbl(
 id     int
,txt    text
,txtarr text[]
);

txtarr就是为了演示INSERT命令中的语法变体。第三行加入了元字符:

INSERT INTO tbl VALUES
 (1, 'foo', '{{1,foo1},{2,bar1},{3,baz1}}')
,(2, 'bar', ARRAY[['1','foo2'],['2','bar2'],['3','baz2']])
,(3, '}b",a{r''', '{{1,foo3},{2,bar3},{3,baz3}}'); -- txt has meta-characters

SELECT * FROM tbl;

简单情况:将两个整数(我使用相同的两次)聚合成二维int数组:

更新:使用自定义聚合函数

更好

使用polymorphic type anyarray它适用于所有基类型:

CREATE AGGREGATE array_agg_mult (anyarray)  (
    SFUNC     = array_cat
   ,STYPE     = anyarray
   ,INITCOND  = '{}'
);

呼叫:

SELECT array_agg_mult(ARRAY[ARRAY[id,id]]) AS x        -- for int
      ,array_agg_mult(ARRAY[ARRAY[id::text,txt]]) AS y -- or text
FROM   tbl;

注意额外的ARRAY[]图层,使其成为多维数组。

Postgres 9.5 +

的更新

Postgres现在提供array_agg()接受数组输入的变体,您可以用以下内容替换上面的自定义函数:

The manual:

  

array_agg(expression)
  ...
  输入数组连接成一个数组   更高的维度(输入必须都具有相同的维度,而不能   是空的或NULL)

答案 1 :(得分:5)

我怀疑如果不了解您的应用程序,我将无法让您一路走到您需要的结果。但我们可以走得很远。对于初学者,有ROW函数:

# SELECT 'foo', ROW(3, 'Bob');
 ?column? |   row   
----------+---------
 foo      | (3,Bob)
(1 row)

这样就可以将整行捆绑到一个单元格中。您还可以通过为其创建类型来使事情更明确:

# CREATE TYPE person(id INTEGER, name VARCHAR);
CREATE TYPE
# SELECT now(), row(3, 'Bob')::person;
              now              |   row   
-------------------------------+---------
 2012-02-03 10:46:13.279512-07 | (3,Bob)
(1 row)

顺便说一下,每当你创建一个表时,PostgreSQL会生成一个相同名称的类型,所以如果你已经有了这样的表,你也有一个类型。例如:

# DROP TYPE person;
DROP TYPE

# CREATE TABLE people (id SERIAL, name VARCHAR);
NOTICE:  CREATE TABLE will create implicit sequence "people_id_seq" for serial column "people.id"
CREATE TABLE

# SELECT 'foo', row(3, 'Bob')::people;
 ?column? |   row   
----------+---------
 foo      | (3,Bob)
(1 row)

在第三个查询中看到我使用people就像一个类型。

现在,由于两个原因,这可能没有你想象的那么多:

  1. 我找不到任何方便的语法来从嵌套行中提取数据。

    我可能会遗漏一些东西,但我没有看到很多人使用这种语法。我在文档中看到的唯一示例是将行值作为参数并使用它执行某些操作的函数。我没有看到一个将行拉出单元格并查询部分内容的示例。看起来你可以用这种方式打包数据,但之后很难解构。你最终必须制作大量的存储过程。

  2. 您的语言的PostgreSQL驱动程序可能无法处理嵌套在一行中的行值数据。

    我不能代表NPGSQL,但由于这是一个非常PostgreSQL特性,你不会在支持其他数据库的库中找到它的支持。例如,Hibernate无法处理获取存储为行中单元格值的对象。我甚至不确定JDBC是否能够有效地为Hibernate提供信息,因此问题可能会非常深入。

  3. 所以,你在这里所做的事情是可行的,前提是你可以在没有很多细节的情况下生活。我建议不要追求它,因为它会在整个过程中成为一场艰苦的战斗,除非我真的被误导了。