广告连播状态失败的原因

时间:2019-04-08 09:27:22

标签: kubernetes kubelet kube-controller-manager

如果Pod的状态为Failed,Kubernetes将尝试创建新的Pod,直到其到达terminated-pod-gc-threshold中的kube-controller-manager。这会将许多Failed个Pod留在群集中,需要清理。

除了Evicted之外,还有其他原因会导致Pod Failed吗?

3 个答案:

答案 0 :(得分:2)

只需执行以下操作:

kubectl get pods <pod_name> -o yaml

在输出中,到最后,您会看到类似以下的内容:

enter image description here

这将使您很好地了解Pod到底在哪里发生故障以及发生了什么情况。

答案 1 :(得分:1)

POD将无法经受调度失败,节点故障或其他驱逐(例如资源不足)或节点维护的情况。 不应手动创建Pod,而应几乎总是通过诸如Deployments(自我修复,复制等)之类的控制器来创建。

可以通过以下原因了解pod失败或终止的原因

kubeclt describe pod <pod_name>

广告连播失败时遇到的其他情况:

  • 问题与图像(不再存在)
  • 当pod尝试访问ConfigMap或Secrets时,但在命名空间中找不到它。
  • 活动探针故障
  • 永久卷无法挂载
  • 验证错误

此外,驱逐是基于资源的-EvictionPolicy

也可能是由于排空节点/吊舱造成的。您可以了解有关DRAIN here的信息。

答案 2 :(得分:1)

POD状态为FAILED的原因有很多。您只需要通过运行命令

来检查是否存在问题(如果存在)
kubectl -n <namespace> describe pod <pod-name>

仔细检查EVENTS部分,其中列出了在POD创建期间发生的所有事件。希望您可以从那里查明故障原因。

但是,POD失败有多种原因,其中一些是以下原因:

  • 用于POD的图像错误。
  • 错误的命令/参数传递给了POD。
  • Kubelet无法检查POD的活动度(即,活动度探测失败)。
  • POD运行状况检查失败。
  • 网络CNI插件中的问题(用于网络的CNI插件配置错误)。