如何下载特定cloudera发行版的源代码?

时间:2015-01-02 08:07:48

标签: hadoop hdfs cloudera

stackoverflow的优秀人员帮助我弄清楚如何在我的ubuntu开发机器上识别特定的cloudera版本。 (dpkg -l | grep cdh)。

现在我想摸索各种来源,但我不知道该去哪里下载它们。假设我想下载hdfs源代码(使用cloudera mods for cdh5.3.0):

dpkg显示的版本是:

hadoop-hdfs 2.5.0 + cdh5.3.0 + 781-1.cdh5.3.0.p0.54~precision

现在,如果我去这个github回购:https://github.com/cloudera/hadoop-hdfs 我没有看到任何包含字符串'5.3.0'的标签。

所以我被困在哪里看。任何指针都将非常感激。

1 个答案:

答案 0 :(得分:6)

您可以通过两种方式下载特定于cloudera版本的源代码。

选项1:来自Maven回购

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-hdfs/2.5.0-cdh5.3.0/hadoop-hdfs-2.5.0-cdh5.3.0-sources.jar

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-common/2.5.0-cdh5.3.0/hadoop-common-2.5.0-cdh5.3.0-sources.jar

(适当更改版本和hadoop组件名称)

选项2:来自tar ball repo

Cloudera以tar ball(hadoop-x.x.x.tar.gz)的形式提供Hadoop关系,这将包含二进制代码和源代码。以下Cloudera存储库中提供了相同的内容。

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.0.tar.gz