在现实世界的应用程序中使用Hive?

时间:2015-03-26 04:54:51

标签: hadoop hive

我是Hadoop堆栈的新手,我已经学习了map-reduce和现在的hive。

但我不确定使用蜂巢?

在map-R中,我们有一个或多个输出文件,这是我们的最终结果,但是在hive中我们可以使用SQL之类的查询来选择记录,即HQL,但我们没有得到任何最终输出文件。结果将仅显示在终端上。

现在我的Q是如何使用这个选择HQL以便其他分析团队可以使用它?

1 个答案:

答案 0 :(得分:1)

有许多方法可以在外部提取/导出配置单元查询结果。

如果您希望将结果存储在任何RDBMS存储中,您可以使用Sqoop。 我建议你看看Sqoop是什么以及它做了什么。

如果您希望查询结果存档,那么有很多方法。 Hive支持从表中导出数据。

INSERT OVERWRITE LOCAL DIRECTORY '/home/lvermeer/temp' 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ',' 
select * from table;

另一种简单的方法是在CLI中运行您的配置单元查询时简单地将配置单元重定向到文件。

hive -e "select * from table" > output.txt