我们一直在使用Apache社区提供的标准Hadoop发行版。我们正在努力开发销售分析解决方案。基于以下文档 https://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support
似乎很多公司为Hadoop提供不同的发行版和商业支持。在我们的例子中,我们只使用标准(Debian)Hadoop发行版。我们遇到了很多问题。 我们的问题是我们是否应该使用这个Debian Hadoop发行版或转移到Cloudera,Hortonworks,MapR ...提供的其他发行版?
答案 0 :(得分:0)
决策过程中会有很多因素,但这里有一些指示:
Cloudera - 所有供应商中最贵的。他们的“Cloudera Manager”是一流的集群管理软件。
Hortonworks - 最便宜且完全开源的组件。
MapR - 在成本方面处于中间位置但在性能方面绝对排名第一。他们完全摆脱了NameNode并进行了一些其他重大改变。
AWS - 它们允许您以较低的每小时成本使用其基础架构。支持是1.5万美元,对于大公司来说是可变数额。如果使用此选项,则无需购买硬件。
还有许多其他发行版,如Pivotal,IBM等,但这三个是市场领导者。
希望这有帮助。