flink检查点E2E持续时间太长

时间:2020-10-29 14:20:57

标签: apache-flink

checkpoint screenshot

一台机器要花很长时间来检查点,但是状态大小与其他机器差不多,这是由于数据漂移还是其他原因? (数据按用户分组)

1 个答案:

答案 0 :(得分:0)

有些东西不知所措。为了找出问题所在,寻找背压延迟检查点屏障到达该子任务的速度,或者资源争用延迟该子任务的快照完成。

像这样的不对称通常是热键的指示-例如,一个有很多事件的用户。