在Ubuntu上安装Hadoop tar文件与Cloudera VM

时间:2016-02-16 03:31:33

标签: hadoop virtual-machine cloudera

我是Hadoop的初学者,我在互联网上发现了各种关于使用VMWare安装Cloudera VM的帖子。最近我看到一个youtube视频,它显示了如何通过从Apache下载hadoop tar文件在ubuntu上安装hadoop但是他们没有安装Cloudera VM。我的问题是:

这两种方法有什么区别?使用一个而不是另一个有什么好处吗?

我想自己学习Hadoop并寻找最佳方式/更多采用的方式来学习它。

2 个答案:

答案 0 :(得分:0)

Cloudera是“还有另一个hadoop发行版”你可以把Nexus手机中的基本Hadoop看作股票机器人,而非nexus手机中的Cloudera Hadoop作为机器人。它基本上是一个定制的版本。

Cloudera更像是一个即插即用版本,这意味着你可以download the VM开始玩Hadoop。

On,另一方面,Ubuntu中的Hadoop是一个搞定你的手模式,你可以在这里建立自己的hadoop。

个人意见 - 我建议您建立自己的Hadoop,以帮助更好地了解Hadoop的内部结构以及随后的Hadoop学习活动。

希望它有所帮助。快乐的Hadooping!

答案 1 :(得分:0)

我花了很多时间玩Cloudera软件并且他们的Quickstart VM很好,直到你开始尝试添加节点。它的设计不是为了做到这一点,但是当你花时间使用它时,最好将它作为真实系统的基础。

所以下一步将是使用CDH(Cloudera的'正确的'Hadoop)或Hortonworks版本的HDP,甚至可能使用MapR(我没有使用它)。

CDH和HDP技术在基本Hadoop上具有很好的GUI功能,并且看起来更容易设置。然而,我花了很多时间试图让CDH和HDP无法正常工作。

当出现问题时,他们会发出红灯和含糊的信息,并在尝试解决问题时添加一层混淆。例如,在普通的hadoop中,您可以轻松更改配置文件,但在CDH中,您无法直接访问它们,您必须发现Cloudera隐藏其各种选项的位置。

如果建议使用普通的hadoop,除非你有一个庞大的组织,很多人和机器。

更新:我终于让HDP工作了,这真的很棒。好Ambari GUi,您可以使用Zeppelin笔记本来制作精美的图形。