我正在考虑使用Pentaho / Kettle进行数据摄取。我已经遇到了问题,但我不确定这是工具的问题还是我缺乏知识。
我已经想出如何创建转换并从XML文件中读取数据,这是我转换的第一部分。不幸的是,我的XML有点像这样:
<rootnode>
<category someattribute="cool" rownum="7">
<firstnode>some data</firstnode>
<secondnode>more data</secondnode>
</category>
<category someattribute="cooler" rownum="8">
<firstnode>some data II</firstnode>
<secondnode>more data II</secondnode>
</category>
</rootnode>
我正在使用XML步骤中的输入/获取数据,虽然我可以让它正确显示所有类别和firstnode / secondnode值,但我找不到任何方法甚至可以一瞥属性rownum和someattribute
Kettle能否处理XML属性并允许您在转换步骤中使用它们?如果是这样,有人或如何有人向我展示有关该主题的文档? (我找不到任何东西)。
答案 0 :(得分:2)
只需将步骤设置为循环类别,然后单击“获取字段”。它将为您提供所有属性和子节点。
一个技巧是将xml放入文件中,设置xml输入步骤以从文件中读取,配置步骤,然后恢复为从字段中读取xml。