希望Acumos Boreas OneClick(和其他安装脚本)现在可以正常工作...
我正代表AI4EU project(任务3.2)尝试在Ubuntu 18.04服务器上再次安装Acumos Boreas版本。不幸的是,我的希望正在减少……
我正在按照2.1.2节中的步骤进行操作: https://docs.acumos.org/en/boreas/submodules/system-integration/docs/oneclick-deploy/user-guide.html#host-vm-preparation
我从一个全新的Ubuntu 18.04虚拟机(使用32G内存,12个核心和300 GB磁盘创建)开始。
执行此操作(并在出现提示时键入sudo密码):
git clone https://gerrit.acumos.org/r/system-integration
cd system-integration/tools/
bash setup_docker.sh
if [[ "$(id -nG "$USER" | grep docker)" == "" ]]; then sudo usermod -aG docker $USER; fi
# Logged out and in again and verified that my user is in the docker group
cd system-integration/tools/
bash setup_k8s_stack.sh setup
cd
bash system-integration/AIO/setup_prereqs.sh k8s acumos.tele.no $USER generic 2>&1 | tee aio_prep.log
# When "Prerequisites setup is complete" messages is displayed I continue with
cd system-integration/AIO
bash oneclick_deploy.sh 2>&1 | tee aio_deploy.log
部署失败,并显示以下错误消息:
....
oneclick_deploy.sh setup_federation:233 (Tue Aug 20 13:47:04 UTC 2019) CDS API is not yet ready; waiting 10 seconds
+ t=300
+ sleep 10
++ curl -k -u ccds_client:27f928e9-cdde-4483-b3c9-7da074972908 https://acumos.tele.no/ccds/peer
++ grep -c numberOfElements
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 203 100 203 0 0 7000 0 --:--:-- --:--:-- --:--:-- 7000
+ [[ 0 -eq 0 ]]
+ [[ 300 -eq 300 ]]
+ fail 'CDS API is not ready after 300 seconds'
+ set +x
当我使用Kubernetes仪表板查看实际失败时,我确实看到common-dataservice pod失败了。
我还可以看到docker_proxy以及其他一些pod经常崩溃。
所有安装和错误日志均位于此处: https://www.dropbox.com/sh/61snwd26zbixwl3/AAAWcfBKnIwNkRghXSMQayrEa?dl=0
如果有人能够指导我如何为AI4EU项目(WP3)安装Acumos Boreas进行探索,将不胜感激。
答案 0 :(得分:0)
Arne,请确保您可以从正在运行的CDS容器中连接到主机“ acumos”。如果这是云服务VM,则可能必须打开安全组规则,以允许VM在其公共IP上与其自身连接(声音是隐式的,但并不总是默认值)。您可以通过
进行测试kubectl exec -it -n acumos $(kubectl get pods -n acumos -l app = sv-scanning | awk'/ sv-scanning / {print $ 1}')-curl http://acumos:30001
注意:此命令示例使用sv-scanning容器,因为它已安装curl。但是,测试旨在查看 any 容器是否可以连接到MariaDB。默认情况下,如果Acumos域不是DNS可解析的(如/ etc / hosts文件中的条目所示),则将hostAlias添加到每个部署模板中。
(更新)我添加了一个脚本来创建调试容器(基于ubuntu),并将其作为Pod在命名空间下运行。这样,您可以添加任何要调试的工具,例如我已经安装了curl,j1,netcat。使用该容器来验证与http://acumos:30001的连接,签出CDS日志等。
#!/bin/bash
kubectl delete deployment -n acumos debug
while [[ "$(kubectl get pods -n acumos -l app=debug)" != "" ]] ; do
echo 'waiting...'; sleep 10
done
cat <<EOF >debug.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
namespace: acumos
name: debug
spec:
selector:
matchLabels:
app: debug
replicas: 1
template:
metadata:
labels:
app: debug
spec:
containers:
- name: debug
image: ubuntu
command: ['/bin/bash', '-c']
args:
- apt-get update; apt-get install -y curl jq netcat;
sleep 3600;
volumeMounts:
- mountPath: /logs
name: logs
restartPolicy: Always
volumes:
- name: logs
persistentVolumeClaim:
claimName: logs
EOF
kubectl create -f debug.yaml
# Wait till running
while [[ $(kubectl get pods -n acumos -o yaml -l app=debug | grep -c 'phase: Running') -eq 0 ]]; do
echo 'waiting...'; sleep 10
done
kubectl exec -it -n acumos $(kubectl get pods -n acumos -l app=debug -o name | sed 's/pod\///') -- bash