Hive从HDFS中的twitter数据查询

时间:2016-11-13 17:41:12

标签: mysql hadoop twitter

我一直关注如何使用Hive分析Twitter数据:http://blog.cloudera.com/blog/2012/11/analyzing-twitter-data-with-hadoop-part-3-querying-semi-structured-data-with-hive/

我已设置水槽来收集推特数据并写入HDFS。我已经设置了一个hive表,它引用了相同的HDFS位置。

当我从hive运行这样的命令时:         SELECT entities.user_mentions [0] .screen_name FROM tweets;

我收到以下回复: 好 所用时间:0.16秒。

我运行的查询无关紧要,我没有得到任何结果。

由于我是Hive的新手,我希望在Hive命令行中看到结果,或者我是否必须从mySQL中挖掘结果。 mySQL是Metastore DB。

1 个答案:

答案 0 :(得分:0)

当使用目录对hive数据进行分区时,需要对其进行rapaired以查看分区/分区。因此,运行msck repair table your_table_name可以解决您的问题。