Pentaho数据集成工具(水壶)XML输入步骤

时间:2013-10-30 12:00:38

标签: xml pentaho

尝试使用XML输入步骤将XML文件提供给Hive。我的XML文件如下所示:

    <breakfast_menu>
     <food>
     <name>Belgian Waffles</name>
     <price>$5.95</price>
     <description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
     <calories>650</calories>
     </food>
     <food>
     <name>Strawberry Belgian Waffles</name>
     <price>$7.95</price>
     <description>Light Belgian waffles covered with strawberries and whipped cream</description>
     <calories>900</calories>
     </food>
     </breakfast_menu>

我希望名称,价格,desc,卡路里在Hive表中显示为列。双击XML输入步骤,将出现配置对话框。在那:

  1. 在“文件”选项卡中,我已在系统上指定了XML文件的位置。

  2. 在“内容”标签中,我将元素位置指定为breakfast_menu,food。

  3. 在“字段”选项卡中,单击“获取字段”时,XML文件中的每个值都将作为字段选取。示例:

  4. E = breakfast_menu / 1,E =食品/ 1,E =名称/ 1

    E = breakfast_menu / 1,E =食品/ 1,E =价格/ 1

    E = breakfast_menu / 1,E =食品/ 1,E =描述/ 1

    E = breakfast_menu / 1,E =食品/ 1,E =卡路里/ 1

    E = breakfast_menu / 1,E = food / 2,E = name / 1等等......

    现在,在单击“预览行”时,它表示未找到要预览的行。所以想看看Pentaho如何从XML文件中生成一个模式并对其进行操作(如果需要)。

    我也尝试过使用XML STAX输入步骤。在那里,预览有两列。在一列中,它列出了XML文件的元素,在第二列中列出了其值。我不希望它那样。不知道如何玩元素并获得所需的字段。

0 个答案:

没有答案