我有一个要求,我需要连接多个ORC格式的Hive表并将输出显示为JSON。
例如,如果我有两个具有1对多关系的Hive表,则我希望输出为具有嵌入式关系和数组的JSON。
是否可以使用本地Hive UDF实现此目的?
我尝试使用https://github.com/klout/brickhouse中的诸如to_JSON之类的谷歌搜索工具,但正在寻找更多Hadoop本机而非第三方的东西。
有人可以帮我吗?
答案 0 :(得分:0)
使用JsonSerDe创建 Hive table
。
然后通过选择联接结果将其插入json表。
示例:
Insert into json_table
select t1.* from tab1 t1 join tab2 t2 on t1.id=t2.id;
Hive表(hdfs目录)中的文件将为 Json格式。