如何禁用apache mesos内存/磁盘隔离?

时间:2016-11-25 07:48:31

标签: mesos aurora

我正在使用docker容器检查Apache Aurora (1.1.0)(0.16.0)和Apache Mesos (0.16.0)(1.1.0)。以下是Aurora作业定义的示例

process_nginx = Process(
    name='nginx',
    cmdline=textwrap.dedent(r'''
        exec /path_to/nginx -g "daemon off; pid /run/nginx.pid; error_log stderr notice;"
    '''),
    min_duration=3,
    daemon=True,
)

task_nginx = Task(
    name='nginx',
    processes=[process_nginx,],
    resources=Resources(
        cpu=0.1,
        ram=20*MB,
        disk=50*MB,
    ),
    finalization_wait=14,
)

job_nginx = Job(
    cluster='x',
    role='root',
    name='nginx',
    instances=6,
    service=True,
    task=task_nginx,
    priority=1,
    #tier='preferred',
    constraints={
        'X_HOST_MACHINE_ID': 'limit:2',
        'HOST_TYPE.FRONTEND': 'true',
    },
    update_config=UpdateConfig(
        batch_size=1,
        watch_secs=29,
        rollback_on_failure=True,
    ),
    container=Docker(
        image='my_nginx_docker_image_name',
        parameters=[
            {'name': 'network', 'value': 'host'},
            {'name': 'log-driver', 'value': 'journald'},
            {'name': 'log-opt', 'value': 'tag=nginx'},
            {'name': 'oom-score-adj', 'value': '-500'},
            {'name': 'memory-swappiness', 'value': '1'},
        ],
    ),
)

但是,由于指定diskram限制令我感到困扰,我想让它们都禁用。

问题1

如果我的所有mesos代理都使用选项--isolation=cgroups/cpu(而不是--isolation=cgroups/cpu,cgroups/mem)启动,我认为只有CPU资源会被隔离(=有限)。

但即使在这种情况下,所有由mesos docker containerizer启动的docker容器都有--memory选项,这是硬限制,如果docker容器需要更多内存,则会导致OOM杀手。 (而且似乎mesos docker containerizer不支持--memory-reservation。)

问题2

即使在--isolation=cgroups/cpu的情况下,从Aurora ram实例中删除diskResource参数也会导致以下错误。

  

加载配置时出错:TypeCheck(FAILED):MesosJob [任务]失败:任务[资源]失败:需要资源[ram]。

我的问题

  • 是否可以禁用内存和磁盘隔离?
  • --isolation=cgroups/cpu--isolation=cgroups/cpu,cgroups/mem之间的区别是什么?

1 个答案:

答案 0 :(得分:1)

正如您所发现的,您可以通过不将它们指定为隔离代理标志的一部分来禁用Mesos中的内存和磁盘隔离器。我不确定Docker Containerizer在这种情况下的行为,但您可能想尝试使用Mesos Containerizer,因为这是在Mesos中继续运行Docker镜像的首选方式。

至于省略Aurora配置中的Resources,遗憾的是,这是不可能的。每个Aurora作业都必须指定其资源要求,以便调度程序可以将您的任务实例与Mesos的提议相匹配。