我是Hadoop堆栈的新手,我已经学习了map-reduce和现在的hive。
但我不确定使用蜂巢?
在map-R中,我们有一个或多个输出文件,这是我们的最终结果,但是在hive中我们可以使用SQL之类的查询来选择记录,即HQL,但我们没有得到任何最终输出文件。结果将仅显示在终端上。
现在我的Q是如何使用这个选择HQL以便其他分析团队可以使用它?
答案 0 :(得分:1)
有许多方法可以在外部提取/导出配置单元查询结果。
如果您希望将结果存储在任何RDBMS存储中,您可以使用Sqoop。 我建议你看看Sqoop是什么以及它做了什么。
如果您希望查询结果存档,那么有很多方法。 Hive支持从表中导出数据。
INSERT OVERWRITE LOCAL DIRECTORY '/home/lvermeer/temp'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
select * from table;
另一种简单的方法是在CLI中运行您的配置单元查询时简单地将配置单元重定向到文件。
hive -e "select * from table" > output.txt