我注意到其中一项 AKS 服务处于失败状态。当我去诊断时,我发现不再支持当前版本。因此,我尝试按照此处说明的说明进行操作:https://docs.microsoft.com/en-us/azure/aks/upgrade-cluster
我先运行了命令:
az aks get-upgrades --resource-group myResourceGroup --name myAKSCluster --output table
然后:
az aks upgrade --resource-group myResourceGroup --name myAKSCluster --kubernetes-version new_version
这会产生一个错误:
<块引用>操作失败,状态为:“冲突”。详情:升级是 当集群处于失败状态时不允许。对于解决步骤 访问 https://aka.ms/aks-cluster-failed 以解决为什么 集群状态可能已失败以及修复集群状态的步骤。
因此,由于旧版本导致状态失败,并且由于状态失败而无法更新版本...
我检查了这个 This container service is in a failed state 但这不是我们的问题,我们有足够的资源来处理(我们用 az aks show --resource-group myResourceGroup --name myAKSCluster --query agentPoolProfiles
检查)
删除和重新创建 AKS 不是一种选择。
答案 0 :(得分:1)
因此,在尝试不同的解决方案并失败了数小时后,我在以下答案中找到了解决方法:https://github.com/Azure/AKS/issues/542
为了修复由于版本过时而导致的失败状态,我只需执行以下操作:
升级到已经存在的版本。所以我的版本是 1.14.8,我只是跑了:
az aks upgrade --resource-group myResourceGroup --name myAKSCluster --kubernetes-version 1.14.8
修复了集群的失败状态!
在此之后,我只是升级到正确的下一个版本(在我的情况下为 1.18.19):
az aks upgrade --resource-group myResourceGroup --name myAKSCluster --kubernetes-version 1.18.19
我希望这会为某些人省去几个小时的挫败感 :)