在Hadoop 2.0时代,名称节点和数据节点术语仍然有效吗?

时间:2016-11-16 23:57:21

标签: hadoop hdfs yarn hadoop2 bigdata

Hadoop 2.0引入了YARN,取代了Job Tracker和Task Tracker的任务。 YARN由资源管理器(调度程序,应用程序管理器...),节点管理器和应用程序主机组成。

在hadoop 2.0环境中,数据节点和名称节点的术语是否仍然存在。如果他们做了他们的意思,这些节点的功能是什么,谁管理它们。加上任何其他有用的信息,请随意添加。

(ps:可能是数据节点和名称节点只是HDFS的一部分,它们与YARN处理的作业处理无关直接。)

2 个答案:

答案 0 :(得分:1)

是的,正如您所说,名称节点和数据节点与hadoop(HDFS)的存储层相关,而不是与处理层(Map Reduce / Yarn)相关。名称节点和数据节点在主/从体系结构中构建,其中名称节点的主节点和数据节点是从属节点。在总结中,他们的职能是:

  • 名称节点:存储文件系统的所有元数据,包括文件名,位置,权限,大小,文件到块的映射,可用块。
  • 数据节点:它们是负责数据本身的组件。

因此,当您将数据加载到hadoop时,它将存储在数据节点中,相应的元数据(文件名,位置,权限,创建日期等)将被存储并在名称节点的内存中编入索引。

答案 1 :(得分:1)

几乎有些人可能称他们为主人/工人。简而言之,Name节点负责管理文件系统命名空间(通过EditLog和FsImage的元数据),并规定客户端对文件的访问。客户端在写入文件(写入位置,块大小)时联系Name节点,但直接将它们写入数据节点。数据节点实际上在本地存储数据。 http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html

并且存在名称节点HA功能,其中存在Active-hot备用支持并且故障转移是无缝的(也是资源管理器HA)。