我一直在关注这个教程How to configure a production ready Mesos cluster,并且一直在创建一个安全的剧本,你可以在这里看到mesos ansible playbook
Ansible成功运行,我可以在主设备上访问我的端口5050并查看mesos仪表板。然而,似乎存在3个问题,希望这些问题都是相互关联的,但看起来似乎是分开的。
自从本教程发布以来,我做错了什么或者有什么改变的想法?
编辑:试图深入挖掘。运行ansible后,我登录每个节点并手动重启mesos和marathon服务。当我到达马拉松仪表板然后经过一些摆弄奴隶之后,我可以看到那些被激活的东西。不幸的是,在节点和重建之后我无法重现。我的设置与我链接的教程和Celine链接的教程一致,所以我认为这是我正在重新启动服务的顺序。仍在寻找任何帮助
EDIT2: 在启动时从其中一个主人复制日志,最后一次http调用重复并重复
I1014 18:56:32.746968 11494 logging.cpp:172] INFO级别日志记录 开始! I1014 18:56:32.748177 11494 main.cpp:229]建立:2015-10-12 20:57:28 by root I1014 18:56:32.748277 11494 main.cpp:231]版本: 0.25.0 I1014 18:56:32.748345 11494 main.cpp:234] Git标签:0.25.0 I1014 18:56:32.748406 11494 main.cpp:238] Git SHA: 2dd7f7ee115fe00b8e098b0a10762a4fa8f4600f I1014 18:56:32.748615 11494 main.cpp:252]使用' HierarchicalDRF'分配器I1014 18:56:32.759768 11494 leveldb.cpp:176]在10.929155ms打开数据库I1014 18:56:32.763638 11494 leveldb.cpp:183]压缩数据库在3.722708ms I1014 18:56:32.763713 11494 leveldb.cpp:198]在33931ns中创建了db迭代器 I1014 18:56:32.763761 11494 leveldb.cpp:204]寻求db的开头 in 8624ns I1014 18:56:32.764142 11494 leveldb.cpp:273] Iterated 通过db中的1个键在352415ns I1014 18:56:32.764263 11494中 replica.cpp:744]使用日志位置0恢复副本 - > 0与1 洞和0没有学习I1014 18:56:32.767266 11520 log.cpp:238] 试图将副本加入ZooKeeper组I1014 18:56:32.767493 11520 recover.cpp:449]开始复制恢复I1014 18:56:32.767623 11520 recover.cpp:475]副本处于投票状态I1014 18:56:32.767695 11520 recover.cpp:464]恢复过程终止 I1014 18:56:32.775274 11494 main.cpp:465]启动Mesos master I1014 18:56:32.779567 11516 master.cpp:376]大师 75abeaaa-a949-45a3-bd85-bebf100eecad(159.203.107.10)开始使用 159.203.107.10:5050 I1014 18:56:32.779597 11516 master.cpp:378]启动时的标志:--allocation_interval =" 1secs" --allocator =" HierarchicalDRF" --authenticate ="假" --authenticate_slaves ="假" --authenticators =" CRAMMD5" --authorizers ="本地" --framework_sorter =" DRF" --help ="假" --hostname =" 159.203.107.10" --hostname_lookup ="真" --initialize_driver_logging ="真" --ip =" 159.203.107.10" --log_auto_initialize ="真" --log_dir =" /无功/日志/ mesos" --logbufsecs =" 0" --logging_level =" INFO" --max_slave_ping_timeouts =" 5" --port =" 5050" --quiet ="假" --quorum =" 1" --recovery_slave_removal_limit =" 100%" --registry =" replicated_log" --registry_fetch_timeout =" 1mins" --registry_store_timeout =" 5secs" --registry_strict ="假" --root_submissions ="真" --slave_ping_timeout =" 15secs" --slave_reregister_timeout =" 10分钟" --user_sorter =" DRF" --version ="假" --webui_dir ="在/ usr /共享/ mesos / WebUI中" --work_dir ="在/ var / lib中/ mesos" --zk =" ZK://159.203.107.10:2181,159.203.107.151:2181,159.203.107.162:2181 / mesos" --zk_session_timeout =" 10secs" I1014 18:56:32.779762 11516 master.cpp:425] Master允许未经身份验证的框架注册 I1014 18:56:32.779770 11516 master.cpp:430]大师允许 未经认证的奴隶登记I1014 18:56:32.779778 11516 master.cpp:467]使用默认' crammd5'验证器W1014 18:56:32.779798 11516 authenticator.cpp:505]没有提供凭据, 身份验证请求将被拒绝I1014 18:56:32.779906 11516 authenticator.cpp:512]初始化服务器SASL I1014 18:56:32.791836 11515 master.cpp:1542]成功附加文件 ' /var/log/mesos/mesos-master.INFO' I1014 18:56:32.792043 11519 contender.cpp:149]加入ZK集团I1014 18:56:34.968217 11517 http.cpp:336]来自12.228.115.34:40863的/master/state.json的HTTP GET 使用User-Agent =' Mozilla / 5.0(Macintosh; Intel Mac OS X 10_10_5) AppleWebKit / 537.36(KHTML,与Gecko一样)Chrome / 45.0.2454.101 Safari浏览器/ 537.36' I1014 18:56:45.242039 11518 http.cpp:336] HTTP GET for /master/state.json来自12.228.115.34:63018 with User-Agent =' Mozilla / 5.0(Macintosh; Intel Mac OS X 10_10_5) AppleWebKit / 537.36(KHTML,与Gecko一样)Chrome / 45.0.2454.101 Safari浏览器/ 537.36' I1014 18:56:55.319259 11519 http.cpp:336] HTTP GET for /master/state.json来自12.228.115.34:50024 User-Agent =' Mozilla / 5.0(Macintosh; Intel Mac OS X 1
由于
答案 0 :(得分:2)
第一个问题“没有主人当前领先”通常是由于zookeeper的问题。
检查zookeeper是否在您的服务器上运行。这也可以解释你对Marathon和mesos奴隶的问题。
此文档似乎更新:http://open.mesosphere.com/getting-started/datacenter/install/
答案 1 :(得分:1)
这是一个zookeeper配置问题。除了列出服务器ips之外,没有一个教程提到需要在zoo.cfg中设置值。您还需要设置dataDir,syncLimit,initLimit,tickTime和clientPort