我喜欢研究Hadoop多节点设置和安装,通过参考上面的教程,我了解单节点集群环境可以用作多节点集群的节点
http://bigdatahandler.com/hadoop-hdfs/hadoop-multi-node-cluster-setup/
目前我正在使用Horton沙箱学习Hadoop,我们可以将沙箱系统用作单节点环境吗?
如果没有沙盒和传统Hadoop集群安装之间的区别
答案 0 :(得分:0)
沙盒图像(来自Hortonworks和Cloudera)为用户提供了一个预先配置的开发环境,其中包含所有常用工具(猪,蜂巢等)。由于图像是单个“系统”,因此设置为使得hadoop群集是单节点的:即,所有内容 - HDFS,Hadoop map-reduce等 - 对于该图像是本地的。这是一个巨大的好处,因为任何设置了一个hadoop集群的人都会告诉你!它允许您以极少的操作开销启动并运行。
然而,这些沙箱不提供的是真实的群集行为,因为您只有一个节点。但是还有其他可能性 - 像Vagrant和Docker这样的工具 - 可以让你这样做(我自己没试过)。
您共享的大数据处理程序链接似乎是关于组合这些独立的,固有的单节点“群集”中的一些,以便您有更现实的东西。但是我猜想这样做是为了让YARN,Zookeeper和其他服务不重复,并带来一个并非无关紧要的挑战。