如何使用Apache-Flink的TaskMangers实现容错(恢复)?

时间:2016-03-11 09:58:53

标签: apache-flink

使用Zookeeper实现了使用JobManager的恢复,但是如果TaskManager失败怎么办?如何从中恢复,JobManager是否自动恢复TaskManagers?

1 个答案:

答案 0 :(得分:3)

通常,JobManager负责从TaskManager故障中恢复。如何完成取决于您的设置。

  • 如果你在YARN上运行Flink,JobManager会在意识到TaskManager已经死亡并重新分配任务时启动一个新的TaskManager。
  • 如果在群集上独立运行Flink,则必须确保运行一个(或多个)备用TaskManager。 JobManager将故障TM的任务分配给备用TM。这也意味着您必须确保有足够的备用TM启动并运行。