Kube-up.sh永远在特定的AWS区域循环

时间:2015-10-01 15:43:36

标签: amazon-web-services kubernetes

当我尝试在AWS中设置新的Kubernetes集群时,我会遇到非常奇怪的行为。

每当我尝试使用默认配置运行kube-up.sh时,它都能正常工作, 集群及其所有相关组件的设置时间不到10分钟。

当我将“kube-aws-zone”设置为us-east-1e(与我当前的VPC相同)而不是us-west-2a(默认值)时,会出现问题。 安装过程陷入循环,并显示以下消息 -

  

群集等待3分钟..................重新运行   salt highstate sudo:无法解析主机ip-172-20-0-9等待   集群初始化。

     

这将不断检查kubernetes的API是否为   到达。如果存在一些未被捕获的错误,这可能永远循环   在启动期间。

我试图在小兵中挖掘一下并在/ var / log / salt / minion中找到这个错误

  

2015-10-01 14:52:54,912 [salt.loaded.int.module.cmdmod] [错误]   命令'runlevel / run / utmp'失败,返回码:1 2015-10-01   14:52:54,913 [salt.loaded.int.module.cmdmod] [错误]输出:太   很多论点。 2015-10-01 14:53:00,902 [salt.state] [错误]   指定的服务kubelet不可用2015-10-01 14:53:03,078   [salt.state] [错误]指定的服务kube-proxy不是   2015-10-01 14:53:16,677 [salt.state] [ERROR] An   此状态发生异常:Traceback(最近一次呼叫最后一次):
  文件“/usr/lib/python2.7/dist-packages/salt/state.py”,第1533行,   呼叫       ** cdata ['kwargs'])文件“/usr/lib/python2.7/dist-packages/salt/states/sysctl.py”,第56行,in   当下       configured = salt 'sysctl.show'文件“/usr/lib/python2.7/dist-packages/salt/modules/linux_sysctl.py”,行   86,在节目中       对于salt.utils.fopen(config_file_path)中的行:文件“/usr/lib/python2.7/dist-packages/salt/utils/init.py”,第1065行,   在fopen       fhandle = open(* args,** kwargs)IOError:[Errno 2]没有这样的文件或目录:'/ etc / sysctl.d / 99-samp.conf'

     

2015-10-01 14:53:16,707 [salt.loaded.int.module.cmdmod] [错误]   命令'runlevel / run / utmp'失败,返回码:1 2015-10-01   14:53:16,708 [salt.loaded.int.module.cmdmod] [错误]输出:太   很多论点。 2015-10-01 14:53:16,719   [salt.loaded.int.module.cmdmod] [错误]命令'服务泊坞窗   状态'失败,返回码:3 2015-10-01 14:53:16,719   [salt.loaded.int.module.cmdmod] [错误]输出:* docker.service -   加载Docker应用程序容器引擎:已加载   (/lib/systemd/system/docker.service; enabled;供应商预设:已启用)   活动:自星期四起激活(自动重启)(结果:退出代码)   2015-10-01 14:53:16 UTC; 262ms前        文档:http://docs.docker.com进程:15285 ExecStart = / usr / bin / docker -d -H fd:// $ DOCKER_OPTS(code = exited,   status = 1 / FAILURE)主PID:15285(代码=退出,状态= 1 / FAILURE)

     

Oct 01 14:53:16 ip-172-20-0-90 systemd [1]:docker.service:main   进程退出,代码=退出,状态= 1 / FAILURE 10月01日14:53:16   ip-172-20-0-90 systemd [1]:单元docker.service进入失败状态。   10月01日14:53:16 ip-172-20-0-90 systemd [1]:docker.service失败了。   2015-10-01 14:53:20,259 [salt.state] [错误]命名   服务kubelet不可用2015-10-01 14:53:20,687 [salt.state
  ] [错误]指定的服务kube-proxy不可用

我已尝试删除并重新设置IAM角色,如同建议的类似问题,但最终没有运气。

非常感谢您的帮助。 谢谢,

1 个答案:

答案 0 :(得分:1)

问题是针对我们东1区的。 我必须编辑作为kube-up.sh的一部分创建的dhcp-set并添加以下内容 -

  

domain-name = ec2.internal

然后它就像魅力一样。

更多信息 - https://github.com/kubernetes/kubernetes/issues/7962#issuecomment-145324441