如何在Mesos框架失败后恢复Mesos执行程序?

时间:2015-06-10 14:32:58

标签: mesos

我的方案是框架在服务器A上运行。它在服务器B上有一个执行任务的执行器(一个长时间运行的Web服务,初始化时间很长)。服务器A已关闭。然后,该框架将在集群中的其他位置重新启动。

目前,重新启动后,新框架会注册一个运行新任务的新执行程序。一段时间后,Mesos主服务器停用旧的和不再运行的框架,这反过来又会杀死旧的但仍在运行的执行程序及其任务。

我希望新框架重新注册旧执行程序而不是注册新执行程序。这可能吗?

1 个答案:

答案 0 :(得分:1)

这在Mesos论坛上回答了我的问题:

http://www.mail-archive.com/user%40mesos.apache.org/msg00069.html

此处包含以供参考:

  
    

(1)我发现一件令人意想不到的事情是遗嘱执行人     如果调度程序已关闭,则关闭。有没有办法保留执行者/任务     调度程序关闭时运行?我会想象调度程序何时到来     回来,它可以以某种方式重新建立状态并继续前进     中断正在运行的任务。这是mesos设计用的用例吗?

  
     

您可以使用FrameworkInfo.failover_timeout告诉Mesos在清理框架之前需要等待框架重新注册多长时间   框架的执行者和任务。

     

另外,请注意,为此,框架必须坚持下去   frameworkId首次向master注册时。当。。。的时候   框架回来了它需要通过设置重新连接   FrameworkInfo.framework_id =持久化ID。