使用hive从使用hadoop中的map reduce程序生成的数据中获取数据

时间:2014-06-04 07:30:44

标签: hadoop hive

我是hadoop的初学者。我已按照https://www.digitalocean.com/community/articles/how-to-install-hadoop-on-ubuntu-13-10成功安装了hadoop,并按照http://www.evanconkle.com/2012/02/writing-hadoop-mapreduce-program-php/提供的关于字数统计的map reduce程序示例。 并且所有步骤都已经完成,我可以看到结果。

现在我想对mapreduce程序生成的数据使用某种类型的sql操作,比如获取所有超过25的单词。

我如何继续这一点。我需要一些指导

1 个答案:

答案 0 :(得分:0)

对于Hadoop中的sql,您必须使用Hive。首先,您必须在Hadoop上安装它。之后,您可以在HQL中运行一些非常类似于SQL的查询。请参阅此处:https://hive.apache.org/