我搜索但无法得到Spark 2的Apache发行版和Spark 2的Cloudera发行版之间的具体区别。任何人都可以帮助我理解它们在spark core,spark sql和spark streaming中的差异。
答案 0 :(得分:2)
他们指的是同一件事。 Cloudera分发了一个包装版本的Hadoop,包括Apache Spark 2.这个Apache Spark 2和来自https://spark.apache.org/的Spark 2的最新上游版本略有不同。这些通常在Release Notes for CDH Spark 2中列出。
例如,发行说明中有一个名为Spark 2 Known Issues的部分描述了一些缺失的功能。
通常,不兼容性的出现是因为上游版本和CDH版本之间存在延迟,CDH必须维持次要版本之间的主要版本兼容性。