我正在尝试通过尝试将我目前通过Python进行的操作移植到Kettle工作来处理Kettle 4.4如何处理数据转换。
我有一个包含四个表的关系数据库,我需要将其导入到我的数据管道中。这是该模型的简化版本......
+-----------+-------------+----------------+
| WIDGET_ID | Name | Notes |
+-----------+-------------+----------------+
| 1 | Gizmo | Red paint job |
| 2 | Large Gizmo | Blue paint job |
+-----------+-------------+----------------+
+-----------+------------+----------------------------------+
| WIDGET_ID | Name | Mailing_Address |
+-----------+------------+----------------------------------+
| 1 | Acme, Inc. | 123 Fake Street, Springfield, IL |
| 2 | Fake Corp. | 555 Main Street, Small Town, IN |
| 2 | Acme, Inc. | 123 Fake Street, Springfield, IL |
+-----------+------------+----------------------------------+
+-----------+--------+------------+
| WIDGET_ID | Amount | Date |
+-----------+--------+------------+
| 2 | 11000 | 2012-01-15 |
| 1 | 13000 | 2012-02-05 |
| 1 | 900 | 2013-01-01 |
+-----------+--------+------------+
我希望能够采用上述方法并生成如下的JSON输出:
{
"id": 1,
"Name": "Gizmo",
"Notes": "Red Paint Job",
"Customers": [
{
"Name": "Acme, Inc.",
"Address": "123 Fake Street..."
}
],
"Inventory": [
{
"Amount": 13000,
"Date": "2012-02-05"
},
{
"Amount": 900,
"Date": "2013-01-01"
}
]
}
我尝试使用Kettle的连接,JS转换和JSON输出并不是很成功,我发现文档非常缺乏。任何人都可以帮助我,或指出我正确的方向吗?
谢谢!
答案 0 :(得分:3)
您可以使用3个(总共6个)水壶步骤进行此转换:
1)为每个表添加3个表格输入步骤。
2)接下来添加一个 Multiway Merge Join 步骤,将3个表输入步骤箭头流分组到此处, 选择widget_id作为关键字段,选择内连接类型。
3)将1 json输出步骤添加到多路连接步骤的输出流程中。
要制作最终的json格式,您必须使用JSONPath表示法:
http://goessner.net/articles/JsonPath/
希望它有所帮助。(如果你是水壶里的新手,我建议你去水壶勺里的样品夹)