应用错误收集

在Hadoop 2.0时代，名称节点和数据节点术语仍然有效吗？

时间：2016-11-16 23:57:21

标签： hadoop hdfs yarn hadoop2 bigdata

Hadoop 2.0引入了YARN，取代了Job Tracker和Task Tracker的任务。 YARN由资源管理器（调度程序，应用程序管理器...），节点管理器和应用程序主机组成。

在hadoop 2.0环境中，数据节点和名称节点的术语是否仍然存在。如果他们做了他们的意思，这些节点的功能是什么，谁管理它们。加上任何其他有用的信息，请随意添加。

（ps：可能是数据节点和名称节点只是HDFS的一部分，它们与YARN处理的作业处理无关直接。）

2 个答案:

答案 0 :(得分：1)

是的，正如您所说，名称节点和数据节点与hadoop（HDFS）的存储层相关，而不是与处理层（Map Reduce / Yarn）相关。名称节点和数据节点在主/从体系结构中构建，其中名称节点的主节点和数据节点是从属节点。在总结中，他们的职能是：

名称节点：存储文件系统的所有元数据，包括文件名，位置，权限，大小，文件到块的映射，可用块。
数据节点：它们是负责数据本身的组件。

因此，当您将数据加载到hadoop时，它将存储在数据节点中，相应的元数据（文件名，位置，权限，创建日期等）将被存储并在名称节点的内存中编入索引。

答案 1 :(得分：1)

几乎有些人可能称他们为主人/工人。简而言之，Name节点负责管理文件系统命名空间（通过EditLog和FsImage的元数据），并规定客户端对文件的访问。客户端在写入文件（写入位置，块大小）时联系Name节点，但直接将它们写入数据节点。数据节点实际上在本地存储数据。 http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html