什么是Hadoop集群?

时间:2014-02-04 14:24:08

标签: hadoop cluster-computing

我很困惑,因为我看到在多个场景中使用了“群集”这个词。以下哪一项正确使用'群集'?

  1. 所有名称节点,作业跟踪器和数据节点
  2. 一组NameNode,JobTracker和DataNodes(还有更多这样的集合)
  3. 编辑: 这种混乱线的一个例子是this pageDistCp (distributed copy) is a tool used for large inter/intra-cluster copying

    如果所有服务器(节点)在一起是一个集群,那么“集群间复制”的问题在哪里?如果服务器的子集是一个集群,那么该子集究竟是什么?

1 个答案:

答案 0 :(得分:1)

Hadoop集群是Master& amp;从节点,主节点为NameNode, Secondary NameNode and Job Tracker& Slave节点为DataNodes and TaskTrackers。在任何hadoop集群中,有1个主节点实例,即1 NameNode, 1 Secondary NameNode and 1 Job Trackermultiple slave nodes (dataNodes and taskTrackers)