当mesos主服务器和代理同时关闭时,mesos群集是否不可接受?

时间:2017-03-21 09:47:33

标签: linux apache-zookeeper mesos marathon dcos

我试图通过三台机器实现HA并拥有主人和像下面的奴隶。我正在使用VM进行本地测试设置,我的观察结果如下。

案例1:

m1 - >领导大师

m2 - >非领导者大师,奴隶1

m3 - >非领导者大师,奴隶2

  • 案例1.1:当我关闭VM m1机器时,非领导者之一变为 领导并能够访问集群,正常工作。

  • 案例1.2:我关闭m2或m3(任何一个与非主和从属的vm)。 我在m3或m2的网页上看到过消息' No Master目前领先'。当我尝试访问m1中的mesos和任何一个可用的机器(m2或m3)时。

情况2:

m1->非领导者

m2-> leader,slave1,

m3->非领导者,奴隶2

  • 案例2.1:当我关闭VM m1机器时,m2中的领导者将会持续并且群集正常工作。

  • 案例2.2:当我关闭m2(带有奴隶的领导者)时,群集变得不可用,并显示错误消息'没有主人当前正在领导'在网页上。

  • 案例2.3:当我关闭m3(带有奴隶的非领导者)时,群集变得不可用,并显示错误消息'没有主人当前领先'在网页上。

在只有3台机器和冗长的问题解释的情况下尝试HA的道歉。

问题:

  • 具有主设备(领先/非领先)和从设备的杀戮机器总是会导致群集不可用? (案例1.2,2.2,2.3)

  • 我们可以用上面的三台机器来实现HA,即在同一台机器上有3个主机和2个带主机和从机的从机吗?

    以下是配置。

硕士:

  

m1:mesos-master --ip = 192.168.1.36 --hostname = 192.168.1.36 --port = 6060 --quorum = 2 --cluster = mesosCluster --zk = zk://192.168.1.36:2181 ,192.168.1.42:2181,192.168.1.45:2181 / mesos --work_dir = / opt / ncms / mesosWorkDir / --log_dir = / opt / ncms / mesosWorkDir / logs

     

m2:mesos-master --ip = 192.168.1.42 --hostname = 192.168.1.42 --port = 6060 --quorum = 2 --cluster = mesosCluster --zk = zk://192.168.1.36:2181 ,192.168.1.42:2181,192.168.1.45:2181 / mesos --work_dir = / opt / ncms / mesosWorkDir / --log_dir = / opt / ncms / mesosWorkDir / logs

     

m3:mesos-master --ip = 192.168.1.45 --hostname = 192.168.1.45 --port = 6060 --quorum = 2 --cluster = mesosCluster --zk = zk://192.168.1.36:2181 ,192.168.1.42:2181,192.168.1.45:2181 / mesos --work_dir = / opt / ncms / mesosWorkDir / --log_dir = / opt / ncms / mesosWorkDir / logs

奴隶:

  

m2:mesos-slave --ip = 192.168.1.42 --hostname = 192.168.1.42 --executor_registration_timeout = 10mins --systemd_enable_support = false --master = zk://192.168.1.42:2181,192.168.1.45: 2181,192.168.1.36:2181 / mesos --containerizers = mesos,docker

     

m3:mesos-slave --ip = 192.168.1.45 --hostname = 192.168.1.45 --executor_registration_timeout = 10mins --systemd_enable_support = false --master = zk://192.168.1.42:2181,192.168.1.45: 2181,192.168.1.36:2181 / mesos --containerizers = mesos,docker

Zookeeper配置:

滚动时间= 2000

initLimit = 10

syncLimit = 5

DATADIR = /选择/ NCMS / zkWorkDir

CLIENTPORT = 2181

server.1 = 192.168.1.42:2888:3888 server.3 = 192.168.1.36:2888:3888

server.5 = 192.168.1.45:2888:3888

设置:

  

主机:Windows 7(64GB内存,24个内核)

     

Virtual Box:每个vm(m1,m2,   m3)有2个内核和2 GB内存和RHEL 7.2

1 个答案:

答案 0 :(得分:0)

在您描述的场景中,活动母版的数量低于quorum,在您的情况下为2。这被视为特殊情况,某些操作将不会成功,例如,任何操作modifying the distributed registry