我有一个高度可用的flink集群,其中有3个节点正在运行以下进程。
1) StandaloneSessionClusterEntrypoint
2) TaskManagerRunner
3) FlinkZooKeeperQuorumPeer
每台机器都分配有10GB的堆内存(任务管理器)和7个插槽。
我已经开始执行11个作业,并且前7个作业已分配给当前的主节点,其余4个作业已分配给第二个节点,而第三台计算机未分配。
原因:主节点内存不足,任务管理器在主服务器中崩溃(丢失了几个作业),因为这三个任务管理器的作业未正确拆分。
可能是什么原因,如何解决此问题??
先谢谢了。 :)