我正在努力学习马拉松和马拉松介子和docker很好,但它最近发现了一个问题。当mesos-slave遇到Exception时,Marathon上的任务状态将变为TASK_LOST,并且任务不能在大约15分钟后被杀死。
我通过手动重启我的操作系统进行了测试,运行mesos-slave服务和docker并运行任务,然后Marathon UI中显示的任务状态变为“Unscheduled(100%)”,并且任务不能手动杀死,直到过去大约15分钟。 我的问题是如何减少这个时间? 我试图用
添加马拉松启动命令行argstask_launch_confirm_timeout=30000
scale_apps_interval = 30000
task_lost_expunge_initial_delay = 30000
task_launch_timeout = 30000
并使用
添加mesos-slave启动命令行参数recovery_timeout=1mins
但它对我不起作用。
答案 0 :(得分:2)
如果Mesos代理程序失败,要强制更改执行者自杀后的时间,您应该配置--recovery_timeout
分配给代理恢复的时间。如果代理程序需要比recovery_timeout更长的时间来恢复,则任何等待重新连接到代理程序的执行程序都将自行终止。 (默认:15分钟)