我看到hadoop的最新稳定版本是0.20.x.最新版本是0.23。。似乎有很多从.20。到0.23.x的通道。
我们能够建立具有稳定中继(0.20.2)的小型集群并实现mapreduce编程。
我们已经看到在0.23.x中添加了很多新api。为了探索0.23.x,我们需要使用0.23.x版本来设置集群。
你们可以给我们一个文档,在那里我们可以设置0.23.x版本的集群。
似乎0.23.x完全不同,当我解压缩tar文件时,它不像0.20.x。请给我们一些书籍参考/文档,其中从开头提到集群设置。
由于 MRK
答案 0 :(得分:2)
0.23和0.23之前版本之间的主要区别在于,在0.23中,资源管理和应用程序生命周期管理已经分开。 Pre-0.23只允许运行MapReduce应用程序,但0.23允许除MapReduce之外的其他应用程序。 Hama,Giraph和其他一些应用程序已经被移植并且MPI的移植正在进行中。
我们已经看到在0.23.x中添加了很多新api。为了探索0.23.x,我们需要使用0.23.x版本来设置集群。
用户API没有任何差异,因此现有应用程序应在没有任何代码更改的情况下运行,但需要更改配置文件。从API的角度来看,0.23版本是向后兼容的。
以下是MRv2架构,视频,文章等的综合列表。当我遇到新信息时,我会尝试更新它们。
答案 1 :(得分:0)