我目前正在阅读Hadoop in Action。这本书非常好,但它使用hadoop 1.2.1来解释和展示所有的例子。但是,我使用的是hadoop 2.2.0。
有谁知道我在哪里可以找到有关hadoop api更改的完整文档?和1.2.1和2.2.0之间的简单映射?
例如
DataJoinMapperBase, DataJoinReducerBase, and TaggedMapOutput
2.2.0中没有出现,我正在寻找2.2.0中的对应物:)
谢谢
答案 0 :(得分:0)
“Hadoop:The Definitive Guide,Third Edition”作者:Tom White (Buy Here)
支持hadoop v2.2。
源代码在github上发布https://github.com/tomwhite/hadoop-book
如github所述,本书的代码用
进行测试This version of the code has been tested with:
* Hadoop 1.2.1/0.22.0/0.23.x/2.2.0
* Avro 1.5.4
* Pig 0.9.1
* Hive 0.8.0
* HBase 0.90.4/0.94.15
* ZooKeeper 3.4.2
* Sqoop 1.4.0-incubating
* MRUnit 0.8.0-incubating
关于您的问题
Hadoop 2.2使用mapreduce api v2而Hadoop 1.x使用旧的mapreduce api。查看本书,它清楚地解释了1.x和2.2之间的mapreduce代码差异。
希望它有所帮助...... !!!