Kubectl正在运行,但我无法访问任何组件

时间:2019-09-26 09:40:18

标签: kubernetes weave

我们有一个小型的私有k8s集群,直到今天早上一切正常,但直到今天早上,kubectl仍在工作,没有流量通过。

我的意思是我可以启动新的部署,将其杀死,等等,我可以看到它们已经启动并正在运行

但是当我想通过http,amqp等访问它们时,我不能。
我正在查看我们的nginx日志并尝试转到主页,但是nginx中没有日志,浏览器中也没有加载任何内容,这意味着nginx没有收到任何流量。
我们正在使用Weave net作为我们的CNI。

我检查了dns日志并进行了测试,dns正常工作。我不知道从哪里开始寻找解决这个问题的建议?

更新

几个小时后,问题几乎解决了,现在我可以访问我的应用程序了,但我想问另一个与此非常相关的问题:

有没有一种方法可以检测到问题是由于联网还是来自群集联网(内部k8s网络)?我之所以这样问,是因为过去我在使用k8s dns时遇到问题,这次我认为k8s的CNI出了问题。

更新2

现在我看到编织中的错误:

ERRO: 2019/09/27 11:10:03.358321 Captured frame from MAC (d2:14:2a:47:62:d9) to (02:01:5b:b9:8e:fd) associated with another peer 4a:8d:75:d7:59:ff(serflex-argus-2)

我的环境:

  • Kubernetes版本:
Client Version: version.Info{Major:"1", Minor:"14", GitVersion:"v1.14.1", GitCommit:"b7394102d6ef778017f2ca4046abbaa23b88c290", GitTreeState:"clean", BuildDate:"2019-04-08T17:11:31Z", GoVersion:"go1.12.1", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"15", GitVersion:"v1.15.3", GitCommit:"2d3c76f9091b6bec110a5e63777c332469e0cba2", GitTreeState:"clean", BuildDate:"2019-08-19T11:05:50Z", GoVersion:"go1.12.9", Compiler:"gc", Platform:"linux/amd64"}
  • 云提供商或硬件配置: 内部私有群集包含5个节点,并使用kubeadm进行设置。

  • OS(例如cat / etc / os-release): 所有机器都在运行Ubuntu 18.04.3

  • 内核(例如,uname -a): Linux k8s-master 4.15.0-62-generic#69-Ubuntu SMP Wed Sep 4 20:55:53 UTC 2019 x86_64 x86_64 x86_64 GNU / Linux
  • 安装工具: kubeadm
  • 网络插件和版本(weave status):
/home/weave # ./weave --local status
        Version: 2.5.2 (up to date; next check at 2019/09/27 15:12:49)
        Service: router
       Protocol: weave 1..2
           Name: 02:01:5b:b9:8e:fd(k8s-master)
     Encryption: disabled
  PeerDiscovery: enabled
        Targets: 1
    Connections: 5 (4 established, 1 failed)
          Peers: 5 (with 20 established connections)
 TrustedSubnets: none
        Service: ipam
         Status: ready
  • Docker版本: Docker version 19.03.2, build 6a30dfc

1 个答案:

答案 0 :(得分:0)

我找不到解决此问题的方法,因此我不得不拆除群集并重新创建它,但是这次我使用了Calico,并且运行了一周之后,没有问题。

我认为唯一可能导致该问题的原因是Weave的200Mb内存限制,以及我的5个Weave Pod中有4个正达到该限制的事实,而且在他们的github上,我发现Weave存在memleak问题因此,我决定更改CNI。