apache-flink - Flink一次性消息处理

我已经设置了一个Flink 1.2独立群集，其中包含2个JobManagers和3个TaskManagers，我正在使用JMeter通过生成Kafka消息/事件对其进行加载测试，然后对其进行处理。处理作业在TaskManager上运行，通常需要~15K事件/秒该作业已设置EXACTLY_ONCE检查点，并将状态和检查点持久保存到Amazon S3。如果我关闭运行作业的TaskManager，它需要几秒钟，然后在另一个TaskManager上恢复作业。该作业主要记录连续整数的事件ID（例如，从0到1200000）当我检查TaskManager上的输出时，我关闭了最后一次计数，例如500000，然后当我在另一个TaskManager上检查恢复作业的输出时，它以~400000开始。这意味着~100K的重复事件。这个数字取决于测试的速度可以更高或更低不确定我是否遗漏了一些东西，但我希望作业在恢复不同的TaskManager后显示下一个连续的数字（如500001）。
有谁知道为什么这发生/额外的设置我必须配置，以获得一次？

Flink一次性消息处理

1 个答案: