当我尝试在AWS中设置新的Kubernetes集群时,我会遇到非常奇怪的行为。
每当我尝试使用默认配置运行kube-up.sh时,它都能正常工作, 集群及其所有相关组件的设置时间不到10分钟。
当我将“kube-aws-zone”设置为us-east-1e(与我当前的VPC相同)而不是us-west-2a(默认值)时,会出现问题。 安装过程陷入循环,并显示以下消息 -
群集等待3分钟..................重新运行 salt highstate sudo:无法解析主机ip-172-20-0-9等待 集群初始化。
这将不断检查kubernetes的API是否为 到达。如果存在一些未被捕获的错误,这可能永远循环 在启动期间。
我试图在小兵中挖掘一下并在/ var / log / salt / minion中找到这个错误
2015-10-01 14:52:54,912 [salt.loaded.int.module.cmdmod] [错误] 命令'runlevel / run / utmp'失败,返回码:1 2015-10-01 14:52:54,913 [salt.loaded.int.module.cmdmod] [错误]输出:太 很多论点。 2015-10-01 14:53:00,902 [salt.state] [错误] 指定的服务kubelet不可用2015-10-01 14:53:03,078 [salt.state] [错误]指定的服务kube-proxy不是 2015-10-01 14:53:16,677 [salt.state] [ERROR] An 此状态发生异常:Traceback(最近一次呼叫最后一次):
文件“/usr/lib/python2.7/dist-packages/salt/state.py”,第1533行, 呼叫 ** cdata ['kwargs'])文件“/usr/lib/python2.7/dist-packages/salt/states/sysctl.py”,第56行,in 当下 configured = salt 'sysctl.show'文件“/usr/lib/python2.7/dist-packages/salt/modules/linux_sysctl.py”,行 86,在节目中 对于salt.utils.fopen(config_file_path)中的行:文件“/usr/lib/python2.7/dist-packages/salt/utils/init.py”,第1065行, 在fopen fhandle = open(* args,** kwargs)IOError:[Errno 2]没有这样的文件或目录:'/ etc / sysctl.d / 99-samp.conf'2015-10-01 14:53:16,707 [salt.loaded.int.module.cmdmod] [错误] 命令'runlevel / run / utmp'失败,返回码:1 2015-10-01 14:53:16,708 [salt.loaded.int.module.cmdmod] [错误]输出:太 很多论点。 2015-10-01 14:53:16,719 [salt.loaded.int.module.cmdmod] [错误]命令'服务泊坞窗 状态'失败,返回码:3 2015-10-01 14:53:16,719 [salt.loaded.int.module.cmdmod] [错误]输出:* docker.service - 加载Docker应用程序容器引擎:已加载 (/lib/systemd/system/docker.service; enabled;供应商预设:已启用) 活动:自星期四起激活(自动重启)(结果:退出代码) 2015-10-01 14:53:16 UTC; 262ms前 文档:http://docs.docker.com进程:15285 ExecStart = / usr / bin / docker -d -H fd:// $ DOCKER_OPTS(code = exited, status = 1 / FAILURE)主PID:15285(代码=退出,状态= 1 / FAILURE)
Oct 01 14:53:16 ip-172-20-0-90 systemd [1]:docker.service:main 进程退出,代码=退出,状态= 1 / FAILURE 10月01日14:53:16 ip-172-20-0-90 systemd [1]:单元docker.service进入失败状态。 10月01日14:53:16 ip-172-20-0-90 systemd [1]:docker.service失败了。 2015-10-01 14:53:20,259 [salt.state] [错误]命名 服务kubelet不可用2015-10-01 14:53:20,687 [salt.state
] [错误]指定的服务kube-proxy不可用
我已尝试删除并重新设置IAM角色,如同建议的类似问题,但最终没有运气。
非常感谢您的帮助。 谢谢,
答案 0 :(得分:1)
问题是针对我们东1区的。 我必须编辑作为kube-up.sh的一部分创建的dhcp-set并添加以下内容 -
domain-name = ec2.internal
然后它就像魅力一样。
更多信息 - https://github.com/kubernetes/kubernetes/issues/7962#issuecomment-145324441