当我在我的机器上安装hadoop时,我发现在apache hadoop网站上预设了两个稳定的文件。第一个是hadoop-1.2.1.bin.tar.gz,第二个是hadoop-1.2.1.tar.gz。所以基本上两个文件的区别是什么。我的猜测是hadoop-1.2.1.bin.tar.gz文件用作hadoop的源代码,hadoop-1.2.1.tar.gz包含所有HDFS应用程序。
答案 0 :(得分:1)
正如其中的文件名自我暗示:
hadoop-1.2.1.bin.tar.gz - 包含二进制文件或可执行文件(在hadoop的后续版本中,这不包含在下载中,需要使用maven在本地构建)
hadoop-1.2.1.tar.gz - 包含您的src代码,该代码已分发供您参考。
最新的稳定版本是2.5.2,强烈建议使用最新版本。