将列值作为键聚合JSON数组

时间:2015-04-23 19:11:56

标签: arrays json postgresql aggregation postgresql-9.3

我有一个场景,我试图聚合数据并将聚合数据插入到另一个表中,所有这些都来自函数内部。数据作为数组和JSON插入到另一个表中。我已经能够很好地聚合到数组中了,但是我在尝试按照我想要的方式将数据聚合成JSON时遇到了一些麻烦。

基本上这里是我聚合的数据样本:

 id_1 | id_2 | cat_ids_array
------+------+---------------
  201 | 4232 | {9,10,11,13}
  201 | 4236 | {11}
  201 | 4249 | {12}
  201 | 4251 | {9,10}
  202 | 4245 | {11}
  202 | 4249 | {12}
  202 | 4251 | {9,10}
  202 | 4259 | {9}
  203 | 4232 | {9,10,11,13}
  203 | 4236 | {11}
  203 | 4249 | {12}
  203 | 4251 | {9,10}
  203 | 4377 | {14}
  204 | 4232 | {15,108}
  204 | 4236 | {15}
  205 | 4232 | {17,109}
  205 | 4245 | {17}
  205 | 4377 | {18}
  206 | 4253 | {20}

当我使用json_agg()id_2cat_ids_array聚合成JSON字符串时,我得到的是:

 id_1 |             json_agg             
------+----------------------------------
  201 | [{"f1":4232,"f2":[9,10,11,13]}, +
      |  {"f1":4236,"f2":[11]},         +
      |  {"f1":4249,"f2":[12]},         +
      |  {"f1":4251,"f2":[9,10]}]
  202 | [{"f1":4245,"f2":[11]},         +
      |  {"f1":4249,"f2":[12]},         +
      |  {"f1":4251,"f2":[9,10]},       +
      |  {"f1":4259,"f2":[9]}]
  203 | [{"f1":4232,"f2":[9,10,11,13]}, +
      |  {"f1":4236,"f2":[11]},         +
      |  {"f1":4249,"f2":[12]},         +
      |  {"f1":4251,"f2":[9,10]}        +
      |  {"f1":4377,"f2":[14]}]
  204 | [{"f1":4232,"f2":[15,108]},     +
      |  {"f1":4236,"f2":[15]}]
  205 | [{"f1":4232,"f2":[17,109]},     +
      |  {"f1":4245,"f2":[17]},         +
      |  {"f1":4377,"f2":[18]}]
  206 | [{"f1":4253,"f2":[20]}]

这是我想要的:

 id_1 | json_agg
------+-------------------------------------------------------------
  201 | [{"4232":[9,10,11,13],"4236":[11],"4249":[12],"4251":[9,10]}]
  202 | [{"4245":[11],"4249":[12],"4251":[9,10],"4259":[9]}]
  203 | [{"4232":[9,10,11,13],"4236":[11],"4249":[12],"4251":[9,10],"4377":[14]}]
  204 | [{"4232":[15,108],"4236":[15]}]
  205 | [{"4232":[17,109],"4245":[17],"4377":[18]}]
  206 | [{"4253":[20]}]

我认为我必须进行某种字符串连接,但我并不完全确定最好的方法。如前所述,我是从一个函数内部做到这一点的,所以我可以灵活处理我能做的事情,因为我不仅限于SELECT语法魔法。

同样相关的是,我正在运行PostgreSQL 9.3.4,并且在不久的将来无法升级到9.4。

1 个答案:

答案 0 :(得分:1)

很遗憾你无法升级,Postgres 9.4有jsonb以及JSON增加了很多功能。特别是json_build_object()对你来说是完美的:

几乎,但不完全

虽然坚持使用Postgres 9.3,但您可以从hstore获得帮助,构建hstore值,其中id_2为关键,cat_ids_array为值:

hstore(id_2::text, cat_ids_array::text)

或者:

hstore(id_2::text, array_to_json(cat_ids_array)::text)

然后:

json_agg(hstore(id_2::text, array_to_json(cat_ids_array)::text))

但是数组不被识别为数组。一旦转换为hstore,它就是Postgres的文本字符串。有hstore_to_json_loose(),但它只标识boolean和数字类型。

解决方案

所以我最终得到了你预测的字符串操作。有各种方法来构造json字符串。每个都或多或少快速/优雅:

format('{"%s":[%s]}', id_2::text, translate(cat_ids_array::text, '{}',''))::json
format('{"%s":%s}', id_2::text, to_json(cat_ids_array))::json
replace(replace(to_json((id_2, cat_ids_array))::text, 'f1":',''),',"f2', '')::json

我选择了第二个变体,似乎是最可靠的,并且适用于其他数组类型而不是简单的int[],这可能需要转义:

SELECT id_1
     , json_agg(format('{"%s":%s}', id_2::text, to_json(cat_ids_array))::json)
FROM   tbl
GROUP  BY 1
ORDER  BY 1;

根据需要得出结果。

SQL Fiddle展示所有。