stackoverflow的优秀人员帮助我弄清楚如何在我的ubuntu开发机器上识别特定的cloudera版本。 (dpkg -l | grep cdh)。
现在我想摸索各种来源,但我不知道该去哪里下载它们。假设我想下载hdfs源代码(使用cloudera mods for cdh5.3.0):
dpkg显示的版本是:
hadoop-hdfs 2.5.0 + cdh5.3.0 + 781-1.cdh5.3.0.p0.54~precision
现在,如果我去这个github回购:https://github.com/cloudera/hadoop-hdfs 我没有看到任何包含字符串'5.3.0'的标签。
所以我被困在哪里看。任何指针都将非常感激。
答案 0 :(得分:6)
您可以通过两种方式下载特定于cloudera版本的源代码。
选项1:来自Maven回购
(适当更改版本和hadoop组件名称)
选项2:来自tar ball repo
Cloudera以tar ball(hadoop-x.x.x.tar.gz)的形式提供Hadoop关系,这将包含二进制代码和源代码。以下Cloudera存储库中提供了相同的内容。
http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.0.tar.gz