Mesos标记框架完成,框架不再接受任何更多任务。这是由于调度程序与mesos主服务器断开连接?我们怎样才能避免这种情况?
答案 0 :(得分:4)
当主人认为已终止并且不会尝试重新连接时,框架已标记为已完成。当框架被拆除(参见teardown endpoint)或断开连接并且不在failover_timeout
内重新注册时,会发生这种情况。
默认failover_timeout
为零秒,因此这可能是这里发生的事情:生产框架通常应该在他们注册到Mesos时在failover_timeout
中设置非默认FrameworkInfo
master(推荐值非常大,例如一周)。有关编写生产质量Mesos框架的更多建议,请参阅Mesos docs。