使用CDH(cloudera)有什么好处?

时间:2015-01-26 07:58:18

标签: hadoop bigdata apache-spark cloudera cloudera-cdh

为什么我们使用CDH(cloudera)而不是使用Apache-Hadoop或Apache-Spark ets。独自?它有什么优势?

如果我想使用Apache-Spark进行数据分析,那么单独使用CDH或Apache-Spark Framework会更好吗?

由于

1 个答案:

答案 0 :(得分:4)

嗯,CDH是" Hadoop发行版"。对我来说,这是一种安装Hadoop"的简单方法。并有一个很好的管理网页界面。因此,您无法真正使用Hadoop的CDH 而不是。 (就像你不能使用Red Hat而不是Linux一样。)

Spark也可以在没有Hadoop的情况下作为独立群集运行。但是,您无法使用HDFS资源位置信息和YARN调度。

要开始使用Spark,我建议首先尝试独立群集,因为Hadoop是一个非常开始的野兽。但是,如果您从一开始就需要HDFS功能,那么我想您无论如何都必须设置Hadoop(无论如何)。