处理xml文件以及配置单元中的其他文件

时间:2013-12-22 14:19:45

标签: hadoop hive

我需要将3个文件加载到hive,1个来自db2,第二个来自mysql,第3个是XML,然后在hive中处理它。 我有sqooped db2和mysql文件。但是如何在hive中加载xml文件以及其他格式相同的文件。 我的解决方案首先使用PIG处理它并将其转换为CSV格式然后处理。

我可以直接在CSV格式的hive中加载XML文件来一起处理所有数据吗? 感谢您的回复

1 个答案:

答案 0 :(得分:0)

您可以使用XPathUDF,查看here了解更多信息