我们目前正在使用以下头盔模板https://github.com/docker-flink/examples/tree/master/helm/flink(带有一些附加配置)在kubernetes上将flink作为作业集群运行。
如果要关闭群集,请重新部署新映像(由于应用程序代码更新)并重新启动,我该如何从保存点还原?
jobmanager命令是严格在standalone-job.sh命令上设置的,如果我在部署k8s资源的参数中添加一个保存点,则如果flink重新启动(由于某些系统错误),它将始终从该位置重新启动保存点,这不是我们想要的。
是否有一种方法可以从最新的保存点进行还原,并且如果该保存点不存在,它将以kubernetes作业集群头盔配置重新开始?
答案 0 :(得分:0)
我认为我不理解您的完整设置,但是我从您的问题中了解到,standalone-job.sh中包含Flink群集和作业恢复脚本。
您可以定期创建保存点,并使用最新的保存点ID更新配置。
您的Flink恢复脚本不应指向特定的保存点,而应指向始终包含最新保存点ID的配置值。
根据Flink作业的更改,始终无法从保存点恢复,因此您也需要考虑这种情况。