应用错误收集

时间：2015-09-09 14:51:34

标签： hadoop mapr

我知道Hadoop基于主/从架构

HDFS适用于NameNodes和DataNodes

和MapReduce适用于jobtrackers和Tasktrackers

但我在MapR找不到所有这些服务，我发现它有自己的架构和自己的服务

我有点困惑，请问任何人请告诉我使用Hadoop和使用MapR之间有什么区别！

答案 0 :(得分：6)

您必须参考Hadoop 2.x自YARN（又一个资源谈判者）＆amp; High Availability已在2.x版本中引入。

作业跟踪器和任务跟踪器将替换为资源管理器，节点管理器和应用程序管理器 。

对于MapR架构，请参阅MapR文章

有关不同分销商之间的比较，请参阅此图片

详细比较可在Bill Vorhies

的Data-magnum文章中找到

答案 1 :(得分：1)

Mapr使用大多数Apache bigdata发行版作为基线。 Mapr是一个hadoop（和bigdata技术堆栈）分发提供商，为其客户提供某些附加功能和技术支持。

下划线mapr完全与apache hadoop在同一架构上，包括所有核心库分发。然而，mapr分发更像是一个完整且兼容的bigdata技术包。

mapr的主要好处在于它的各种技术（如hive，hbase，spark等）的分布将与核心hadoop相互兼容。这一点尤其重要，因为bigdata技术正在以不同的速度发展，因此新闻发布很快就会变得不兼容。

因此，像mapr，cloudera等供应商正在提供他们的hadoop版本和支持版本，以便最终用户可以专注于产品构建而不必担心兼容性问题。但几乎所有人都在地毯下使用apache发布。

将来，他们可能会提出某些变体和附加功能，以防止客户转换到其他供应商，但截至目前情况并非如此。