我知道Hadoop
基于主/从架构
HDFS
适用于NameNodes
和DataNodes
和MapReduce
适用于jobtrackers
和Tasktrackers
但我在MapR
找不到所有这些服务,我发现它有自己的架构和自己的服务
我有点困惑,请问任何人请告诉我使用Hadoop和使用MapR之间有什么区别!
答案 0 :(得分:6)
您必须参考Hadoop 2.x
自YARN
(又一个资源谈判者)& High Availability
已在2.x版本中引入。
作业跟踪器和任务跟踪器将替换为资源管理器,节点管理器和应用程序管理器 。
Hadoop 2.x YARN& High Availability
对于MapR
架构,请参阅MapR文章
有关不同分销商之间的比较,请参阅此图片
详细比较可在Bill Vorhies
答案 1 :(得分:1)
Mapr使用大多数Apache bigdata发行版作为基线。 Mapr是一个hadoop(和bigdata技术堆栈)分发提供商,为其客户提供某些附加功能和技术支持。
下划线mapr完全与apache hadoop在同一架构上,包括所有核心库分发。然而,mapr分发更像是一个完整且兼容的bigdata技术包。
mapr的主要好处在于它的各种技术(如hive,hbase,spark等)的分布将与核心hadoop相互兼容。这一点尤其重要,因为bigdata技术正在以不同的速度发展,因此新闻发布很快就会变得不兼容。
因此,像mapr,cloudera等供应商正在提供他们的hadoop版本和支持版本,以便最终用户可以专注于产品构建而不必担心兼容性问题。但几乎所有人都在地毯下使用apache发布。
将来,他们可能会提出某些变体和附加功能,以防止客户转换到其他供应商,但截至目前情况并非如此。