标签: apache-flink
checkpoint screenshot
一台机器要花很长时间来检查点,但是状态大小与其他机器差不多,这是由于数据漂移还是其他原因? (数据按用户分组)
答案 0 :(得分:0)
有些东西不知所措。为了找出问题所在,寻找背压延迟检查点屏障到达该子任务的速度,或者资源争用延迟该子任务的快照完成。
像这样的不对称通常是热键的指示-例如,一个有很多事件的用户。