在flink群集重新启动时自动恢复作业

时间:2020-01-29 12:28:50

标签: apache-flink restart

我正在使用单个作业管理器在独立的flink群集上运行作业,该作业管理器在docker容器中运行。每当群集崩溃并重新启动时,我都必须再次手动提交作业才能启动它们。一旦集群再次运行,是否可以使flink自动恢复作业?

1 个答案:

答案 0 :(得分:1)

如果作业因引发异常而崩溃,则只要(1)您拥有checkpointing enabled(默认情况下由于需要进行某些配置而被禁用),并且(2)您将自动重启作业尚未设置阻止重启的restart strategy(默认重启策略很好)。如果独立集群中的任务管理器完全失败,则需要启动另一个任务管理器。

要配置作业管理器故障转移,请参阅docs on high availability for standalone clusters