我们假设 Apache Airflow 中有一个工作流程,其中包含一些任务。
这种分布式体系结构的目标之一是努力拥有自治模块:
替代解决方案可能是:
可能还有其他一些架构解决方案,例如将DOMAIN_1状态保留在数据库中,然后在DOMAIN_2中具有一些计划的Java服务,该服务将尝试根据上述保留的信息来处理业务逻辑。
Apache Airflow中是否有可以解决这种情况的模式?
可能总是通过REST作为具有某些重复策略的单独运算符来触发DOMAIN_2。 Apache Airflow中有GUI,用户可以过滤过滤器并尝试不时手动重复失败的任务。
Apache Airflow是可扩展的,由Message Broker和分布式任务引擎(Celery)驱动。也许仅仅是为了与其他域集成而引入额外的维护RabbitMQ的开销是没有意义的?