新版 Flink 应用部署失败

时间:2021-06-17 07:00:24

标签: apache-flink flink-streaming

  • 环境
    • flink 1.7.1
    • 卡夫卡 1.0.1

我在 Streaming 过程中使用 Flink 应用程序。 从 kafka 读取主题并将其下沉到 kafka 新主题。

当我用新版本的代码更改应用程序并部署时,应用程序执行失败。

如果我在更改应用代码后部署相同的 group.id,会不会与之前的状态检查点信息冲突?

1 个答案:

答案 0 :(得分:1)

是的,如果您正在尝试对 Flink 应用程序进行有状态升级,有一些事情可能会导致它失败。

有状态运算符的 UID 用于查找每个运算符的状态。如果你没有设置 UID,那么如果作业的拓扑发生了变化,状态恢复将失败,因为 Flink 将无法找到状态。有关详细信息,请参阅 the docs on Assigning Operator IDs

如果您删除了有状态运算符,那么您应该在指定 -allowNonRestoredState 的同时运行新作业。

如果您修改了数据类型,则在尝试反序列化检查点或保存点中的状态时,作业可能会失败。 Flink 1.7 不支持自动模式演化或状态迁移。在最新版本的 Flink 中,如果您坚持使用 POJO 或 Avro,这会自动处理。否则,您需要自定义序列化程序。

如果这不能帮助您找出问题所在,请分享显示特定异常的日志中的信息。

相关问题