尝试使用XML输入步骤将XML文件提供给Hive。我的XML文件如下所示:
<breakfast_menu>
<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
<calories>650</calories>
</food>
<food>
<name>Strawberry Belgian Waffles</name>
<price>$7.95</price>
<description>Light Belgian waffles covered with strawberries and whipped cream</description>
<calories>900</calories>
</food>
</breakfast_menu>
我希望名称,价格,desc,卡路里在Hive表中显示为列。双击XML输入步骤,将出现配置对话框。在那:
在“文件”选项卡中,我已在系统上指定了XML文件的位置。
在“内容”标签中,我将元素位置指定为breakfast_menu,food。
在“字段”选项卡中,单击“获取字段”时,XML文件中的每个值都将作为字段选取。示例:
E = breakfast_menu / 1,E =食品/ 1,E =名称/ 1
E = breakfast_menu / 1,E =食品/ 1,E =价格/ 1
E = breakfast_menu / 1,E =食品/ 1,E =描述/ 1
E = breakfast_menu / 1,E =食品/ 1,E =卡路里/ 1
E = breakfast_menu / 1,E = food / 2,E = name / 1等等......
现在,在单击“预览行”时,它表示未找到要预览的行。所以想看看Pentaho如何从XML文件中生成一个模式并对其进行操作(如果需要)。
我也尝试过使用XML STAX输入步骤。在那里,预览有两列。在一列中,它列出了XML文件的元素,在第二列中列出了其值。我不希望它那样。不知道如何玩元素并获得所需的字段。