创建3节点Hadoop群集

时间:2019-08-31 16:00:52

标签: ubuntu hadoop cluster-computing

我要在我的Ubuntu 16机器和两台AWS EC2机器上创建3节点Hadoop集群。

我的本​​地计算机(Ubuntu 16)将作为名称节点,其他两台AWS EC2计算机将作为数据节点。

我几乎没有疑问。

1)我是否还需要在DataNodes(AWS EC2机器)上安装Hadoop,就像我已经在Name节点(“我的本地机器”)上安装Hadoop一样??

2)我可以在群集中的所有节点之间通信(名称节点到数据节点,反之亦然)。在“我需要在其中添加数据节点的名称节点”中,在“名称”节点机器中添加“公共DNS”,以便我的“名称”节点可以将数据传播到我的两个数据节点群集中。

请分享您的输入..!

谢谢

1 个答案:

答案 0 :(得分:1)

  1. Hadoop名称节点版本应该是所有数据节点的精确副本。 然后只有集群才能工作。
  2. 如果使用的是更高版本的hadoop- 3.0,则在 workers 文件中,您可以指定datanode ip或DNS。

    OR

  3. 如果您使用的是hadoop- 3.0的较低版本,则在从属服务器文件中,指定datanode ip或DNS。