我是hadoop的新手。我最近阅读了Apache Hadoop,Pig,Hive,HBase的基础知识。 然后我遇到了术语" Hadoop发行版"例子是Cloudera,MAPR,HortonWorks。 那么Apache Hadoop(及其回声系统)与" Hadoop Distribution"的关系是什么?
它是Java虚拟机规范(文档)和Oracle JVM,IBM JVM(文档的工作实现)吗? 但我们从Apache获得了拉链,这实际上是逻辑实现的。
所以我有点困惑。
答案 0 :(得分:3)
Since Hadoop is an open source project, a number of vendors have developed
their own distributions, adding new functionality or improving the code base
当然,供应商分发 旨在克服开源版本的问题并为客户提供额外价值,重点关注以下内容:
可靠性:检测到错误时,供应商反应更快。他们及时提供修复和补丁,使他们的解决方案更加稳定。
支持:各种公司都提供技术支持,这使得可以采用平台进行关键任务和企业级任务。
完整性:Hadoop发行版经常补充其他工具来解决特定任务。
查看这篇top-hadoop-distributions文章和此presentation,了解三大Hadoop发行版之间的基准分析。
答案 1 :(得分:2)
基于Distributions and Commercial Support,以下公司提供的产品包括Apache Hadoop,其衍生作品,商业支持和/或与Hadoop相关的工具和实用程序。
一些公司发布或销售包含官方Apache Hadoop发布文件和/或他们自己和其他有用工具的产品。其他公司或组织发布的产品包含从Apache Hadoop源代码树的修改版或扩展版构建的工件。 Apache团队不支持此类衍生作品:所有支持问题都必须针对供应商本身。