典型的Hadoop架构和MapR架构之间的区别

时间:2015-09-09 14:51:34

标签: hadoop mapr

我知道Hadoop基于主/从架构

HDFS适用于NameNodesDataNodes

MapReduce适用于jobtrackersTasktrackers

但我在MapR找不到所有这些服务,我发现它有自己的架构和自己的服务

我有点困惑,请问任何人请告诉我使用Hadoop和使用MapR之间有什么区别!

2 个答案:

答案 0 :(得分:6)

您必须参考Hadoop 2.xYARN(又一个资源谈判者)& High Availability已在2.x版本中引入。

作业跟踪器和任务跟踪器将替换为资源管理器,节点管理器和应用程序管理器

Hadoop 2.x YARN& High Availability

对于MapR架构,请参阅MapR文章

有关不同分销商之间的比较,请参阅此图片

enter image description here

详细比较可在Bill Vorhies

Data-magnum文章中找到

答案 1 :(得分:1)

Mapr使用大多数Apache bigdata发行版作为基线。 enter image description here Mapr是一个hadoop(和bigdata技术堆栈)分发提供商,为其客户提供某些附加功能和技术支持。

下划线mapr完全与apache hadoop在同一架构上,包括所有核心库分发。然而,mapr分发更像是一个完整且兼容的bigdata技术包。

mapr的主要好处在于它的各种技术(如hive,hbase,spark等)的分布将与核心hadoop相互兼容。这一点尤其重要,因为bigdata技术正在以不同的速度发展,因此新闻发布很快就会变得不兼容。

因此,像mapr,cloudera等供应商正在提供他们的hadoop版本和支持版本,以便最终用户可以专注于产品构建而不必担心兼容性问题。但几乎所有人都在地毯下使用apache发布。

将来,他们可能会提出某些变体和附加功能,以防止客户转换到其他供应商,但截至目前情况并非如此。