我在GKE集群上使用mysql:5.7
映像部署了MySQL服务器。它部署有一个副本,并通过名为“ mysql-server”的ClusterIP服务公开。
在过去的几个小时中,我遇到了其他正在运行Python服务器的pod反复出现的不稳定错误:
sqlalchemy.exc.OperationalError: (pymysql.err.OperationalError) (2003, "Can't connect to MySQL server on 'mysql-server' ([Errno -3] Temporary failure in name resolution)")
我已经检查了Kubernetes DNS debugging,没有发现任何错误或其他问题,除了CoreDNS在我的任何集群中根本没有运行。
在另一个Pod上执行nslookup mysql-server
时,输出正常。
Server: 10.39.240.10
Address: 10.39.240.10#53
Name: mysql-server.default.svc.cluster.local
Address: 10.39.245.88
但是,ping mysql-server
从不返回,也不知道它是否相关。
PING mysql-server.default.svc.cluster.local (10.39.245.88) 56(84) bytes of data.
^C
--- mysql-server.default.svc.cluster.local ping statistics ---
3 packets transmitted, 0 received, 100% packet loss, time 2039ms
这是mysql还是GKE上的问题?如何进一步调试?