主节点在数据节点上运行是否正确?

时间:2018-08-30 16:36:51

标签: hadoop yarn giraph

我正在使用带有纱线轮廓的giraph-1.3。首先,我在ec2集群上配置了1个namenode和2个datanode。 我的应用程序正常运行,因为我在日志(和输出目录)中看到了预期的输出。我用“ -w 2”参数启动了giraph,因为我有两个数据节点。

在datanode1的用户日志中,我找到了第一个工作程序的日志。
在datanode2的用户日志中,我也找到了第二个工作日志和主日志。

我希望在namenode中找到master的日志,即我希望master在namenode上运行。是吗?

也许我必须配置另一个数据节点,然后才能在这个新的数据节点上找到主日志?

2 个答案:

答案 0 :(得分:0)

我了解到hadoop / giraph可以在datanode上创建容器。 Hadoop为应用程序主数据库创建容器,然后giraph为主数据库创建容器。此外,giraph为-w参数对应的工作人员创建了许多容器。

答案 1 :(得分:0)

YARN始终为每个作业创建一个应用程序主控。

根据您的工作负载,您可以根据需要启动任意数量的“工作人员”,但是由于您只有2个数据节点,因此只能有2个NodeManager以实现最大并行度

NodeManager拥有最大的可用存储空间,并且作业任务的YARN容器获取该分区的一个子部分以便进行处理。