应用错误收集

使用hive从使用hadoop中的map reduce程序生成的数据中获取数据

时间：2014-06-04 07:30:44

标签： hadoop hive

我是hadoop的初学者。我已按照https://www.digitalocean.com/community/articles/how-to-install-hadoop-on-ubuntu-13-10成功安装了hadoop，并按照http://www.evanconkle.com/2012/02/writing-hadoop-mapreduce-program-php/提供的关于字数统计的map reduce程序示例。并且所有步骤都已经完成，我可以看到结果。

现在我想对mapreduce程序生成的数据使用某种类型的sql操作，比如获取所有超过25的单词。

我如何继续这一点。我需要一些指导

1 个答案:

答案 0 :(得分：0)

对于Hadoop中的sql，您必须使用Hive。首先，您必须在Hadoop上安装它。之后，您可以在HQL中运行一些非常类似于SQL的查询。请参阅此处：https://hive.apache.org/