标签: hadoop hdfs oozie oozie-coordinator
我正在尝试创建一个Oozie协调器,该协调器仅在最后一个协调器向Hive表写入分区后才能启动。
仅当数据集在分区的文件夹中具有_SUCCESS标志或该文件夹根本不存在时,协调器才会启动。 后一个要求很重要,因为在某些情况下,先前的工作流程有时根本不会处理任何数据,因此,即使工作流程成功了,也不会在配置单元上创建分区,也不会写入任何数据,并且不会有_SUCCESS文件进行无数据运行。
是否可以通过数据集和输入事件或仅通过决策节点来实现这种要求?