如何使用oozie协调员延迟工作流程操作

时间:2017-02-03 10:09:14

标签: java hadoop oozie job-scheduling oozie-coordinator

我有一个oozie协调员和工作流程工作, 当我的一个工作流程动作完成后,我需要在一段时间之后开始下一个动作让我们说50分钟。 我可以从oozie工作流程或oozie协调器配置等待一段时间来执行下一个操作(取决于之前的操作和之前启动的一些异步任务)。

coordinator xml

<coordinator-app name="ods-ds-cms-coordinator" start="${startTime}" end="${endTime}"
                 frequency="${coord:days(1)}" timezone="${timeZone}" xmlns="uri:oozie:coordinator:0.5">
    <action>
        <workflow>
            <app-path>${exampleDir}/ods-ds-cms-workflow.workflow</app-path>
            <configuration>
                <property>
                    <name>nameNode</name>
                    <value>${nameNode}</value>
                </property>
                <property>
                    <name>jobTracker</name>
                    <value>${jobTracker}</value>
                </property>
                <property>
                    <name>exampleDir</name>
                    <value>${nameNode}/custom/oozie</value>
                </property>
            </configuration>
        </workflow>
    </action>
</coordinator-app>

workflow.xml

<?xml version="1.0" encoding="UTF-8"?>

<workflow-app xmlns="uri:oozie:workflow:0.5" name="ods-ds-cms-workflow.workflow">
  <global>
    <job-tracker>${jobTracker}</job-tracker>
    <name-node>${nameNode}</name-node>
    <configuration>
      <property>
        <name>mapred.job.queue.name</name>
        <value>${queue}</value>
      </property>
    </configuration>
  </global>
  <start to="cms-checker"/>
  <action name="cms-checker">
    <java>
      <main-class>com.insense.helper.CMSPullChecker</main-class>
      <arg>${cmsChecker}</arg>
      <arg>${cmsType}</arg>
      <capture-output/>
    </java>
    <ok to="trigger_next_job"/>
    <error to="kill"/>
  </action>
  <action name="trigger_next_job"> // need to start this after some time
    <sub-workflow>
      <app-path>${exampleDir}/ods-ds-bank.workflow</app-path>
      <propagate-configuration/>
    </sub-workflow>
  <ok to="end"/>
  <error to="kill"/>
  </action>

我如何使用oozie框架存档,我可以使用带有Thread.sleep(50 * 60 * 1000)的java动作来执行此操作,是否更好地处理oozie?

1 个答案:

答案 0 :(得分:1)

您只需一个作业即可创建另一个工作流程 - Shell作业。然后你应该用一个命令创建shell脚本:

sleep 50m

当完成一个工作流程时,您应该使用sleep命令执行此工作流程。下一个工作流程将在50分钟后开始。

实施例

workflow.xml

<workflow-app name="My_Workflow" xmlns="uri:oozie:workflow:0.5">
<start to="shell-3322"/>
<kill name="Kill">
    <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
</kill>
<action name="shell-3322">
    <shell xmlns="uri:oozie:shell-action:0.1">
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <exec>sleep.sh</exec>
        <file>sleep.sh#sleep.sh</file>
          <capture-output/>
    </shell>
    <ok to="End"/>
    <error to="Kill"/>
</action>
<end name="End"/>

sleep.sh

sleep 50m