Mesos马拉松不能破坏工作

时间:2016-10-03 15:25:57

标签: mesos marathon dcos

我有一个运行网站的dcos群集。该网站运行在20个docker实例上。当我查看我的应用程序时,我发现我有24个实例。其中2个实例已开始状态,但未知健康,2个状态已暂停。以前部署的旧实例 我尝试了以下内容:

  • 销毁应用程序(结果:错误销毁/ azure-tracking-api:期货在[10000毫秒]后超时)
  • 杀死所有实例(结果:它们都重启)

在日志中,除了

之外,我没有看到任何重大错误

无法在调度程序-93d96b66-c66e-4d28-b56e处杀死任务azure-tracking-api.908a6c3e-8948-11e6-be5a-7e591cfeda59框架517c75b9-0a13-4b3b-a29d-8d754239991b-0000(马拉松) -8b2b2b959bf8@172.16.0.7:42546因为它未知;执行对帐

我使用的版本是0.28.1

我的问题是我可以用几个命令解决这个问题。我知道如何解决这个问题的唯一方法是设置一个新的集群。

1 个答案:

答案 0 :(得分:2)

您正在使用的Marathon版本(1.1.2)已知issues任务丢失。在Azure上提供DC / OS 1.8后,最佳选择是升级。作为一种解决方法,目前,您可以使用Marathon' HTTP API手动删除任务:

$ curl -X DELETE $MARATHON_URL/v2/apps/azure-tracking-api/tasks/$TASKID?force=true