我想知道从配置角度和理论角度有什么不同?
这两种模式是否使用不同的端口号?或任何其他差异?
答案 0 :(得分:33)
我的2美分。
默认情况下,Hadoop配置为以非分布式或独立模式运行,作为单个Java进程运行。没有守护进程在运行,并且所有内容都在单个JVM实例中运行。不使用HDFS。
除了JAVA_HOME
之外,您不必为配置做任何事情。只需下载tarball,解压缩它,你就可以了。
Hadoop守护程序在本地计算机上运行,因此可以小规模地模拟集群。不同的Hadoop守护程序在不同的JVM实例中运行,但在一台机器上运行。使用HDFS代替本地FS。
就伪分布式设置而言,您需要至少设置以下2个属性以及JAVA_HOME
:
fs.default.name
中 core-site.xml
。
mapred.job.tracker
中 mapred-site.xml
。
您可以拥有多个数据节点和任务分析器,但这在单台机器上没有多大意义。
HTH
答案 1 :(得分:2)
单个节点设置是指您(可能)在一台计算机上拥有一个datanode和一个tasktracker的设置。
伪分布式设置是指您在一台计算机上拥有多个数据节点和(可能是)任务执行器的地方。因此,您在一台计算机上运行多个datanode服务实例来模拟多节点集群。