当前设置
问题陈述
由于我们的集群已被数据科学家和分析人员广泛使用,仅拥有24个容器是不够的。这导致大量的资源争用。
有什么办法可以增加容器数量?
我们正在考虑的选项
请求
答案 0 :(得分:0)
除非您使用YARN with CGroups并启用了yarn.nodemanager.resource.percentage-physical-cpu-limit
,否则Vcore只是一个逻辑单元,与CPU内核无关。大多数任务很少受CPU约束,而更常见的是受网络I / O约束。因此,如果要查看群集的总体CPU使用率和内存使用率,则应该能够根据浪费的(备用)容量来调整容器的大小。
您可以使用多种工具来衡量利用率,但是sar
,ganglia
和grafana
是显而易见的工具,但是您也可以参考Brendan Gregg的Linux Performance tools了解更多信息