标签: azure kubernetes azure-kubernetes
假设我的集群中有3个节点,我想运行300个作业。
如果我运行100 pods per NODE和{{1}},如果节点在Azure Kubernetes Service中发生故障会怎样?
100 pods per NODE
答案 0 :(得分:1)
这些作业将挂起,因为Kubernetes每个节点支持110个Pod,因此将没有资源来支持故障转移的作业。您可以看一下使用集群自动缩放器(Beta),它将提供更多主机,以满足运行处于挂起状态的作业的需要。
答案 1 :(得分:0)
如果节点发生故障
集群自动缩放器(CA)可用于使用自动缩放组处理Azure中的节点故障:
https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/cloudprovider/azure/README.md
https://docs.microsoft.com/en-us/azure/aks/autoscaler
https://docs.microsoft.com/en-us/azure/aks/scale-cluster