我有一个由4个不同活动组成的管道。每项活动都是下一项活动的先决条件。也就是说,第一个活动为第二个活动生成输入,第二个活动生成第三个活动的输入,等等。我已将所有输入和输出文件夹定义为表格,在我的管道中,我将每个作业的输出添加为下一个的输入。
我的假设是每个活动都会被执行并生成输出文件夹,然后下一个活动将其作为输入。但是,当我执行管道时,第一个活动成功完成,但是当执行第二个活动时,看起来第一个活动正在执行,因为第二个活动失败并且错误消息显示第一个活动正在执行且失败(因为我没有通过所需的参数)!我在活动执行方式中遗漏了什么?
我的活动是HDInsight活动。
我来自Oozie背景,并将管道视为oozie工作流程。
答案 0 :(得分:0)
基本上,输出数据表中的可用性配置设置确定活动的运行时间。 您可以尝试将作业拆分为单独的管道。我还认为在图表中以这种方式查看并调试整个流程会更容易。
编辑:您可以使用系统变量(WindowsStart等)在管道chaining activities中链接活动。但我仍然认为从视觉和调试方面来说,更容易将活动与管道分开。
答案 1 :(得分:0)
管道由1-n个活动组成,管道中的每个活动可以有0-n个输入和1-n个输出。您可以在管道中chain activities并设置管道active period,即开始和结束以执行管道中的活动。