我想根据前一个日期的控制文件的可用性运行工作流程。我的目录中的日期格式是$ {basePath} /YYYYMMdd/00/_Complete。我想查看00中的_Complete文件。我的作业将每天运行前一天的数据。我尝试了类似问题中提供的选项,但仍然无法正常工作。例如,当我测试具有低于值的当天数据时,它正在工作但不是(-1)选项。是否对URI-TEMPLATE格式有任何限制,这意味着我们需要以固定格式路径/ $ {YEAR} $ {$ MONTH} $ {DAY} /完成 请帮忙。
<instance>${coord:current(0)}</instance>
这是我的协调员工作的dryrun输出。
***coordJob after parsing: ***
<coordinator-app xmlns="uri:oozie:coordinator:0.1" name="my_Scheduler_5f" frequency="1" start="2016-08-17T23:40Z" end="2016-08-19T23:45Z" timezone="America/Los_Angeles" freq_timeunit="DAY" end_of_duration="NONE">
<controls>
<timeout>30</timeout>
</controls>
<input-events>
<data-in name="coordInput_1" dataset="input1">
<dataset name="input1" frequency="1" initial-instance="2016-08-17T00:00Z" timezone="America/Los_Angeles" freq_timeunit="DAY" end_of_duration="NONE">
<uri-template>${nameNode}/myHdfsPath/Finalpath1/${YEAR}${MONTH}${DAY}/00/</uri-template>
<done-flag>_Complete</done-flag>
</dataset>
<instance>${coord:current(-1)}</instance>
</data-in>
<data-in name="coordInput_2" dataset="input2">
<dataset name="input2" frequency="1" initial-instance="2016-08-17T23:00Z" timezone="America/Los_Angeles" freq_timeunit="DAY" end_of_duration="NONE">
<uri-template>${nameNode}/myHdfsPath/Finalpath2/${YEAR}${MONTH}${DAY}/00/</uri-template>
<done-flag>_Complete</done-flag>
</dataset>
<instance>${coord:current(-1)}</instance>
</data-in>
</input-events>
<action>
<workflow>
<app-path>${nameNode}/myHdfsPath/My_POC/wf-app-dir</app-path>
<configuration>
<property>
<name>date</name>
<value>${coord:formatTime(coord:dateOffset(coord:actualTime(),-1,'DAY'), "yyyyMMdd")}</value>
</property>
</workflow>
</action>
</coordinator-app>
***actions for instance***
答案 0 :(得分:0)
我能够使用单独的_Complete
和<datasets>
来查找正确的<input-events>
标记。
<datasets>
<dataset name="input1" frequency="1" initial-instance="2016-08-17T00:00Z" timezone="America/Los_Angeles" freq_timeunit="DAY" end_of_duration="NONE">
<uri-template>${nameNode}/myHdfsPath/Finalpath1/${YEAR}${MONTH}${DAY}/00/</uri-template>
<done-flag>_Complete</done-flag>
</dataset>
... input2 ...
</datasets>
<input-events>
<data-in name="coordInput_1" dataset="input1">
<instance>${coord:current(-1)}</instance>
</data-in>
... coordInput_2 ...
</input-events>
current(-1)
是昨天指定的部分(对于每日数据集)。就我而言,问题在于我复制了current(0)
的示例。