标签: hadoop mapreduce hbase hdfs hiveql
我有一个学术课程“中间件”,涵盖分布式软件系统的不同方面,包括[标签:分布式文件系统]等主题的介绍。这还涉及对hbase,hadoop,mapreduce,hiveql,piglatin的介绍。 我想知道,我可以有一个小项目试图整合上述技术。对于初学者,我知道vm提供的cloudera感觉hadoop并且使用Eclipse。 我正在考虑实现一个接受事件流作为输入的应用程序,分析它并给出输出。
我的机器上有windows / linux和i7 procoessor以及4Gb Ram。
请告诉我如何开始使用所有内容,欢迎任何有关简单示例应用的建议。
答案 0 :(得分:1)
Here是一篇关于使用Hive / HDFS分析推文的博客文章。 here是一篇关于使用Pig和Hive执行点击流分析的博文。
检查一些大数据用例here并尝试解决一个有趣的问题。