Hadoop MapReduce的项目构想

时间:2010-03-02 18:42:19

标签: hadoop mapreduce

几个月前我学习了Hadoop并设法在其上做了一个非常初级的编程项目。我想用Hadoop做一个中小型项目或一系列小编程作业。我已经看到很多想法,但我没有看到任何可以在大约60-70小时的工作中完成的事情,所以这是一个非常小的项目,因为我想在业余时间和其他研究一起做。我见过的大多数项目创意有点大,持续2-3个月。我的主要目标是利用Hadoop环境开发编程方面的良好专业知识,不做任何研究或解决具体问题。我看到Hadoop被广泛用于webservices,这对于小型项目来说可能是一个有趣的轨道。

提前谢谢。

此致 阿迪亚

1 个答案:

答案 0 :(得分:1)

我最近遇到了UMD开发的Cloud9 MapReduce library。从你以前关于NLP的问题来看,我认为这可能对你有用。

页面底部有一些练习可能会为您提供一个起点。

有关使用MapReduce进行文本处理的一些信息,您可以查看由其作者Jimmy Lin链接的本草案:

Data-Intensive Text Processing with MapReduce