我们有一项可以批量发送大量事件的服务。它基本上会打开多个http POST连接。
自从我们将服务移至kubernetes以来,我们不时出现getaddrinfo: Temporary failure in name resolution
个错误。 (大多数通话有效,但有些失败,这很奇怪。
谁能解释为什么以及如何解决?
谢谢!
答案 0 :(得分:0)
检查火种,他们有类似的问题:
https://medium.com/tinder-engineering/tinders-move-to-kubernetes-cda2a6372f44
及其dns信息的来源:
https://www.weave.works/blog/racy-conntrack-and-dns-lookup-timeouts
TLDR:检查您的arp表缓存gc_ *主机参数,尝试在容器/etc/gai.conf中禁用AAAA查询,将DNS移至守护程序集,并将作为dns服务器的主机IP注入到pods