KDB中的RDB到JSON?

时间:2013-04-29 17:30:30

标签: json etl pentaho kettle

我正在尝试通过尝试将我目前通过Python进行的操作移植到Kettle工作来处理Kettle 4.4如何处理数据转换。

我有一个包含四个表的关系数据库,我需要将其导入到我的数据管道中。这是该模型的简化版本......

窗口小部件

+-----------+-------------+----------------+
| WIDGET_ID |    Name     |     Notes      |
+-----------+-------------+----------------+
|         1 | Gizmo       | Red paint job  |
|         2 | Large Gizmo | Blue paint job |
+-----------+-------------+----------------+

客户

+-----------+------------+----------------------------------+
| WIDGET_ID |    Name    |         Mailing_Address          |
+-----------+------------+----------------------------------+
|         1 | Acme, Inc. | 123 Fake Street, Springfield, IL |
|         2 | Fake Corp. | 555 Main Street, Small Town, IN  |
|         2 | Acme, Inc. | 123 Fake Street, Springfield, IL |
+-----------+------------+----------------------------------+

广告

+-----------+--------+------------+
| WIDGET_ID | Amount |    Date    |
+-----------+--------+------------+
|         2 |  11000 | 2012-01-15 |
|         1 |  13000 | 2012-02-05 |
|         1 |    900 | 2013-01-01 |
+-----------+--------+------------+

我希望能够采用上述方法并生成如下的JSON输出:

{
    "id": 1,
    "Name": "Gizmo",
    "Notes": "Red Paint Job",
    "Customers": [
        {
            "Name": "Acme, Inc.",
            "Address": "123 Fake Street..."
        }
    ],
    "Inventory": [
        {
            "Amount": 13000,
            "Date": "2012-02-05"
        },
        {
            "Amount": 900,
            "Date": "2013-01-01"
        }
    ]
}

我尝试使用Kettle的连接,JS转换和JSON输出并不是很成功,我发现文档非常缺乏。任何人都可以帮助我,或指出我正确的方向吗?

谢谢!

1 个答案:

答案 0 :(得分:3)

您可以使用3个(总共6个)水壶步骤进行此转换:

1)为每个表添加3个表格输入步骤

2)接下来添加一个 Multiway Merge Join 步骤,将3个表输入步骤箭头流分组到此处, 选择widget_id作为关键字段,选择内连接类型。

3)将1 json输出步骤添加到多路连接步骤的输出流程中。

要制作最终的json格式,您必须使用JSONPath表示法:

http://goessner.net/articles/JsonPath/

希望它有所帮助。

(如果你是水壶里的新手,我建议你去水壶勺里的样品夹)