我要在我的Ubuntu 16机器和两台AWS EC2机器上创建3节点Hadoop集群。
我的本地计算机(Ubuntu 16)将作为名称节点,其他两台AWS EC2计算机将作为数据节点。
我几乎没有疑问。
1)我是否还需要在DataNodes(AWS EC2机器)上安装Hadoop,就像我已经在Name节点(“我的本地机器”)上安装Hadoop一样??
2)我可以在群集中的所有节点之间通信(名称节点到数据节点,反之亦然)。在“我需要在其中添加数据节点的名称节点”中,在“名称”节点机器中添加“公共DNS”,以便我的“名称”节点可以将数据传播到我的两个数据节点群集中。
请分享您的输入..!
谢谢
答案 0 :(得分:1)
如果使用的是更高版本的hadoop- 3.0,则在 workers 文件中,您可以指定datanode ip或DNS。
OR