我是talend的新手,并尝试解析xml文档并生成etl序列以维护子父关系。这里的情况是我有这样的xml:
<RDF>
<footPrint>
<custid>123</custid>
<item>
<itemCd>apple</itemCd>
</item>
<item>
<itemCd>orange</itemCd>
</item>
</footPrint>
<footPrint>
<custid>456</custid>
<item>
<itemCd>grapes</itemCd>
</item>
<item>
<itemCd>kiwi</itemCd>
</item>
</footPrint>
</RDF>
我想要实现的输出是:
id | Custid | item_seq | item
-------------------------------
1 | 123 | 1 | apple
1 | 123 | 2 | orange
2 | 456 | 1 | grapes
2 | 456 | 2 | kiwi
任何帮助将不胜感激。
答案 0 :(得分:0)
使用tFIleInputXML并将Xpath循环查询设置为&#34; / RDF / footPrint / item&#34;
向架构添加两列,即cust_id和item。这些列将自动重新映射内容。
比cust_id将Xpath查询设置为 - &#34; ../ custid&#34; 对于项目集Xpath查询到&#34; itemCd&#34;
你会得到你的结果。 希望这有帮助...