我已经尝试过Amazon为EMR实例提供的JSON SerDe,如果您需要将JSON字典字段地址/映射到列,则效果很好。但是我无法想象如何对JSON数组做同样的事情。例如,如果有一个JSON数组,如下所示:
[23123.32,“文字文字”,{“key1”:“value1”}]
有没有办法将数组的第一个元素映射到Hive表中的列?嵌入式字典字段怎么样?
答案 0 :(得分:4)
我一直在努力解决同样的问题,直到我在github上找到这个serde - https://github.com/rcongiu/Hive-JSON-Serde 只需在启动配置单元时使用“add jar”命令包含它,它就像魅力一样。