我已经开始在我的5节点1.7.10 k8s群集中注意到,在同一节点上安排的pod无法相互通信.. nslookup无法从该节点上的任何pod获取任何服务,但在从不同节点运行时工作正常..不确定这是否是一个kube dns / flannel问题,关于如何调试这个的任何指针?
要解决这个问题,我必须在一个全新的节点上重新安排这些pod。我试过重新启动法兰绒,它没有帮助。下次发生这种情况时,将重新启动kube-dns pod。
- 示例
举一个例子,我们在同一节点上安排了kafka和zk(运行正常,由另一个节点上的另一个kafka pod使用)。卡夫卡无法找到zk。 nslookup从该kafka pod失败,但从任何其他pod都可以正常工作。这不是kafka问题,因为我们在不同pod之间的其他节点上存在此问题。我如何检查kube-dns条目 - kube-dns日志似乎显示所有设置都很好并且没有错误
```
[2017-11-22 12:00:56,194] FATAL Fatal error during KafkaServerStartable startup. Prepare to shutdown (kafka.server.KafkaServerStartable)
org.I0Itec.zkclient.exception.ZkTimeoutException: Unable to connect to zookeeper server 'zookeeper:2181' with timeout of 6000 ms
at org.I0Itec.zkclient.ZkClient.connect(ZkClient.java:1233)
at org.I0Itec.zkclient.ZkClient.<init>(ZkClient.java:157)
at org.I0Itec.zkclient.ZkClient.<init>(ZkClient.java:131)
at kafka.utils.ZkUtils$.createZkClientAndConnection(ZkUtils.scala:106)
at kafka.utils.ZkUtils$.apply(ZkUtils.scala:88)
at kafka.server.KafkaServer.initZk(KafkaServer.scala:329)
at kafka.server.KafkaServer.startup(KafkaServer.scala:187)
at kafka.server.KafkaServerStartable.startup(KafkaServerStartable.scala:39)
at kafka.Kafka$.main(Kafka.scala:67)
at kafka.Kafka.main(Kafka.scala)
[2017-11-22 12:00:56,208] INFO shutting down (kafka.server.KafkaServer)
```