GKE:节点重启/ pod缺失

时间:2016-04-12 23:53:03

标签: google-kubernetes-engine

美好的一天,

运行单个节点群集。注意到我的所有豆荚都在一夜之间失踪了。

buildscript {
    repositories {
        jcenter()
    }
    dependencies {
        classpath 'com.android.tools.build:gradle:2.1.0-alpha5'
    }
}


android {
    compileSdkVersion 23
    buildToolsVersion "23.0.3"
    ...
}

什么也没得到我。

检查节点

kubectl get events

检查节点上的容器我注意到一些系统容器只能运行21个小时,而其他系统容器则需要2周:

# kubectl get no
NAME                            STATUS    AGE
gke-sg-etl-4ff0f964-node-jny8   Ready     20d

我知道该节点可能已重新启动。

我在哪里可以了解为何发生这种情况?我的解释是这是正常的,但我仍然希望得到一些洞察力(豆荚是"宠物",不是"牛")。

1 个答案:

答案 0 :(得分:1)

我怀疑它是由于机器重启导致的,因为我预计fluentd-gcp也会重新启动。

在这种情况下,你可以探索一些途径,但我没有一个单独的答案会一直告诉你答案。以下是您可能尝试的一些事项:

  • 运行kubectl get pods -a,它将返回包含不再运行的所有广告连播。如果必须由控制器重新创建pod,您应该能够看到终止状态 那些不再运行的那些。
  • SSH到节点并运行last | grep boot以查看上次启动的时间。
  • SSH到节点并运行docker ps -a以查看所有容器,包括已停止运行的容器。如果有些内容已停止投放,请使用docker logsdocker inspect进行调查。
  • SSH到节点并调查/var/log/kubelet.log文件以查看它是否有关于重新启动pod的原因的任何提示。