应用错误收集

时间：2020-06-11 14:03:16

标签： apache-flink flink-streaming

我们目前正在使用以下头盔模板https://github.com/docker-flink/examples/tree/master/helm/flink（带有一些附加配置）在kubernetes上将flink作为作业集群运行。

如果要关闭群集，请重新部署新映像（由于应用程序代码更新）并重新启动，我该如何从保存点还原？

jobmanager命令是严格在standalone-job.sh命令上设置的，如果我在部署k8s资源的参数中添加一个保存点，则如果flink重新启动（由于某些系统错误），它将始终从该位置重新启动保存点，这不是我们想要的。

是否有一种方法可以从最新的保存点进行还原，并且如果该保存点不存在，它将以kubernetes作业集群头盔配置重新开始？

答案 0 :(得分：0)

我认为我不理解您的完整设置，但是我从您的问题中了解到，standalone-job.sh中包含Flink群集和作业恢复脚本。

您可以定期创建保存点，并使用最新的保存点ID更新配置。

您的Flink恢复脚本不应指向特定的保存点，而应指向始终包含最新保存点ID的配置值。

根据Flink作业的更改，始终无法从保存点恢复，因此您也需要考虑这种情况。