将Hadoop应用程序从开发环境迁移到生产环境

时间:2014-11-05 14:14:01

标签: hadoop hive apache-pig oozie hadoop2

我们正在开发一个POC来在Hadoop中构建一个数据湖。在这方面,我们正在Hadoop之上评估ETL工具(Talend,Sqoop),Pig脚本,HIVE,Ooozie,Spark等。

我正在研究的清晰度是,

  1. 如何规划​​从开发环境到生产的工作/代码发布?
  2. 如何规划​​基于hadoop的应用程序从开发环境到生产环境的发布?
  3. 当开发/迁移发生在生产环境之间时,所有需要移动的东西?任何建议,做什么和不做什么?
  4. 如何将猪脚本,HIVE(Metastore / tables),Oozie配置从开发环境转移到生产环境?
  5. 最重要的是,除了HIVE / PIG / OOzie之外,是否还需要任何Java组件?如果是,如何将这些java组件移动到hadoop?

    我们是否有可能在java中编写一些自定义实用程序并在hadoop上下文中使用它们?这些Java组件将由Hive,Pig等使用......

    任何回复和指导都将不胜感激。

    -Prakhyat M M

0 个答案:

没有答案