我从Oozie官方网站上读到:Actions Are Asynchronous
操作节点触发的所有计算/处理任务都由Oozie异步执行。对于由工作流操作触发的大多数类型的计算/处理任务,工作流作业必须等到计算/处理任务完成后再转换到工作流中的以下节点。
在同一网站的不同页面上:Fs HDFS action
引入FS行动(同步行动)告诉:
FS命令在FS操作中同步执行,工作流作业将等到指定的文件命令完成后再继续执行下一个操作。
为什么同步和异步的介绍基本相同?根据我从操作系统原理课程的理解,异步意味着函数不会等待而是继续执行。
答案 0 :(得分:3)
摘自:Mohammad Kamrul Islam和Aravind Srinivasan。 “Apache Oozie。”
异步操作:所有Hadoop操作和<shell>
操作都遵循“操作执行模型”。这些被称为异步操作,因为它们是通过启动器作为Hadoop作业启动的。
同步操作:文件系统操作,电子邮件操作,SSH操作和子工作流操作由Oozie服务器本身执行,称为同步操作。执行这些同步操作不需要运行任何用户代码 - 只需访问某些库。
基本上,在这两种情况下,Oozie服务器等待操作完成,然后只移动到DAG中的下一个操作。分离主要基于actinos是在同一个Oozie服务器上还是在Hadoop集群上执行。
以下是Oozie动作及其动作执行模型的列表。