我在 csv 格式的 HDFS (Azure HDInsight )中有数据。我正在使用 Pig 来处理此数据。在 Pig 处理后,汇总数据将存储在Hive中。然后使用 Sqoop 在RDBMS中导出 Hive 表。现在我需要自动化所有这一过程。我是否有可能在 MapReduce 中为所有这3个任务编写特定方法,然后运行此 MapReduce 作业,并且所有这些任务逐个执行。 要创建MapReduce作业,我想使用。 Net SDK 。所以我的问题是这可能,如果是,而不是为本课题建议一些步骤和参考 链接。 谢谢。