单节点和单节点之间有什么区别? Hadoop中的伪分布式模式?

时间:2014-05-02 19:12:21

标签: hadoop configuration mode

我想知道从配置角度和理论角度有什么不同?

这两种模式是否使用不同的端口号?或任何其他差异?

2 个答案:

答案 0 :(得分:33)

我的2美分。

单节点设置(独立设置)

默认情况下,Hadoop配置为以非分布式或独立模式运行,作为单个Java进程运行。没有守护进程在运行,并且所有内容都在单个JVM实例中运行。不使用HDFS。

除了JAVA_HOME之外,您不必为配置做任何事情。只需下载tarball,解压缩它,你就可以了。

伪分布式模式

Hadoop守护程序在本地计算机上运行,​​因此可以小规模地模拟集群。不同的Hadoop守护程序在不同的JVM实例中运行,但在一台机器上运行。使用HDFS代替本地FS。

就伪分布式设置而言,您需要至少设置以下2个属性以及JAVA_HOME

    fs.default.name
  1. core-site.xml

  2. mapred.job.tracker
  3. mapred-site.xml

  4. 您可以拥有多个数据节点和任务分析器,但这在单台机器上没有多大意义。

    HTH

答案 1 :(得分:2)

单个节点设置是指您(可能)在一台计算机上拥有一个datanode和一个tasktracker的设置。

伪分布式设置是指您在一台计算机上拥有多个数据节点和(可能是)任务执行器的地方。因此,您在一台计算机上运行多个datanode服务实例来模拟多节点集群。