标签: hadoop hive
我需要将3个文件加载到hive,1个来自db2,第二个来自mysql,第3个是XML,然后在hive中处理它。 我有sqooped db2和mysql文件。但是如何在hive中加载xml文件以及其他格式相同的文件。 我的解决方案首先使用PIG处理它并将其转换为CSV格式然后处理。
我可以直接在CSV格式的hive中加载XML文件来一起处理所有数据吗? 感谢您的回复
答案 0 :(得分:0)
您可以使用XPathUDF,查看here了解更多信息