选择两个Hive表的结果作为JSON输出

时间:2019-01-31 20:40:52

标签: json hadoop hive

我有一个要求,我需要连接多个ORC格式的Hive表并将输出显示为JSON。

例如,如果我有两个具有1对多关系的Hive表,则我希望输出为具有嵌入式关系和数组的JSON。

是否可以使用本地Hive UDF实现此目的?

我尝试使用https://github.com/klout/brickhouse中的诸如to_JSON之类的谷歌搜索工具,但正在寻找更多Hadoop本机而非第三方的东西。

有人可以帮我吗?

1 个答案:

答案 0 :(得分:0)

使用JsonSerDe创建 Hive table

然后通过选择联接结果将其插入json表。

示例:

Insert into json_table 
select t1.* from tab1 t1 join tab2 t2 on t1.id=t2.id;

Hive表(hdfs目录)中的文件将为 Json格式