Hadoop:哪种配置很好

时间:2012-10-16 09:09:54

标签: hadoop mapreduce

hadoop配置有什么好处。

大量小型机器,每台机器配备512 MB Ram或少量大型机器(有些像2Gb或4GB Ram)

我可以选择两者中的任何一个,因为我的节点将是VM ..

请分享您的想法..

1 个答案:

答案 0 :(得分:2)

瓶颈非常依赖于您使用的应用程序类型。但总的来说,我会恕我直言说你的记忆假设是关闭的。你应该得到更少,更快的主流机器。如何配置每台计算机取决于它的角色,但是大多数512 MB虚拟机也无法与具有良好网络/ CPU和磁盘的12-24 GB主流服务器匹配。

标准大容量设备是可行的方法,但实际转化为:

首先获得每台机器每台机器的高效性能,然后再“侧身”。只有与动力不足的机器“横向”变得更加昂贵。

廉价机器集群并不意味着“任何机器”(与一些流行的看法相反)。每个节点的开销非常大,因此添加内存,磁盘空间和磁盘吞吐量以及CPU通常比添加下一个节点更有效。这当然只有在您仍然处于“高容量硬件”类别(主流 快速 服务器)的程度。应避免使用时钟频率,内存和磁盘的最后一英里。

因此,为了回答您的问题,请使用具有12 GB RAM和快速CPU以及大型快速磁盘的千兆以太网计算机。确保所有机器都在千兆交换机上运行。

BTW,很多人推荐双插槽机,Xeon CPU,raid磁盘和24 GB RAM,并认为这为Hadoop提供了最佳性能/美元。