对于单个CDH(Hadoop)群集安装,我应该使用哪个主机?

时间:2012-11-06 17:41:08

标签: linux hadoop cloudera

我从一台Windows 7计算机开始,并设置了一个Ubuntu Linux虚拟机which I run using VirtualBoxThe Cloudera Manager Free Edition version 4已被执行,我一直关注localhost:7180上的提示。

当提示要求我“为CDH群集安装指定主机”时,我现在卡住了。我可以单独在linux虚拟机中安装所有Hadoop组件并运行它们吗?

请帮助指出我应该指定哪个主人的正确方向。

2 个答案:

答案 0 :(得分:0)

您可以指定机器的主机名。它只会在你的机器上安装所有东西。

答案 1 :(得分:0)

是的,你可以单独在linux虚拟机中运行cdh。您可以使用“独立”或“伪分布”模式执行此操作。恕我直言,最有效的方法是使用“伪分布式”模式。

在这种情况下,有多个java虚拟机(JVM)正在运行,因此它们模拟为具有多个节点的集群(每个线程被模拟为集群节点)。

Cloudera已经记录了如何部署为“伪分布式”:

https://www.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_qs_cdh5_pseudo.html

注意:部署cdh的3种方式:

  1. 独立:单独使用机器,使用独特的jvm
  2. 伪分布:单独使用一台机器,但是几台jvm,所以 模拟为集群
  3. 分布式:使用集群,所以有几个 具有不同目的的节点(worker,namenode等)。