当使用的cpu资源平均为71%时,Mesos dcos绝不会允许服务启动

时间:2018-05-25 10:31:12

标签: configuration mesos mesosphere

我有一个问题,我们试图在我们的mesos dcos集群上运行多个服务,有些正在运行spark进程和一些python服务。因此,在我们的小型测试介质dcos集群中,我们每天多次使用70%的cpus资源。

人们想要开始的服务只是等待在从节点上可以很好地满足的cpu提供,但是不允许分配一些共振。

一个典型的例子是7个未使用的cpus和1-3个服务寻找要使用的0.5到2个cpu资源的cpu提供。这可以满足。如果在视图上查看节点资源。

对于我的问题是否存在硬限制,不允许同时分配超过70%的cpus?

对于这个限制是否有共振会将更改为更高值的效果?

最后谁改变了限制?

1 个答案:

答案 0 :(得分:0)

答案似乎是调试方案1的mesospheres文档中所述。

但不是问题是一个角色问题,或者我们试图直接分配更多,然后集群可以处理。 https://docs.mesosphere.com/1.11/tutorials/dcos-debug/scenarios/scen-1/ 问题是我们的一些服务正在保留cpu资源。

reserved_resources “:{” 卡桑德拉角色 “:{” 磁盘 “:10496.0,” MEM “:5152.0,” 图形处理器 “:0.0” 的的CPU “:1.6 下,” 端口 “:” [7000-7001,7199-7199,9042-9042]“} “卡夫卡角色”:{ “磁盘”:5256.0, “MEM”:2080.0, “图形处理器”:0.0,的 “的CPU”:1.1 下, “端口”: “[1025至1025年]”} }

总共2.8或者介绍2.81

假设在这种情况下,从节点最多有4个cpus remning in应该是1.19,这是我可以请求并仍然获得资源的数量。

这在尝试找到答案时非常误导,因为GUI只显示使用的而不是保留的。

我能够通过经历找到答案 https:/// mesos / state-summary

只是为了展示另一件事,我找到了一个节点 “主机名”: “1.0.1.199”, “端口”:5051, “属性”:{}, “PID”: “从机(1)@ 1.0.1.199:5051”, “registered_time”:1526561517.17816, “reregistered_time”: 1526561517.17896,“resources”:{“disk”:119266.0,“mem”:29476.0,“gpus”:0.0,“cpus”:4.0,“ports”:“[1025-2180,2182-3887,3889-5049,5052 -8079,8082-8180,8182-32000]“},”used_resources“:{”disk“:15752.0,”mem“:6368.0,”gpus“:0.0,”cpus“:1.81,”ports“:”[1025 -1025,7000-7001,7199-7199,9042-9042]“},”provided_resources“:{”disk“:0.0,”mem“:0.0,”gpus“:0.0,”cpus“:0.0},”reserved_resources “:{”cassandra-role“:{”disk“:10496.0,”mem“:5152.0,”gpus“:0.0,”cpus“:1.6,”ports“:”[7000-7001,7199-7199,9042- 9042] “},” 卡夫卡角色 “:{” 磁盘 “:5256.0,” MEM “:2080.0,” 图形处理器 “:0.0,” 的CPU “:1.1,” 端口 “:”[1025至1025年]“}}, “ unreserved_resources ”:{“disk”:103514.0,“mem”:22244.0,“gpus”:0.0,“cpus”:1.3,“ports”:“[1026-2180,2182-3887, 3889-5049,5052-6999,7002-7198,72000-8079,8082-8180,8182-9041,9043-32000]“}

unreserved_resources :给出“cpus”:1.3,“这个值我不明白为什么它是一个1.3而不是1.19。鉴于1.19是调试页面显示的内容以及我的内容可以要求并从服务器1.0.1.199获取。