尝试安装Acumos Boreas版本的错误

时间:2019-08-21 07:52:25

标签: acumos

希望Acumos Boreas OneClick(和其他安装脚本)现在可以正常工作...

我正代表AI4EU project(任务3.2)尝试在Ubuntu 18.04服务器上再次安装Acumos Boreas版本。不幸的是,我的希望正在减少……

我正在按照2.1.2节中的步骤进行操作: https://docs.acumos.org/en/boreas/submodules/system-integration/docs/oneclick-deploy/user-guide.html#host-vm-preparation

我从一个全新的Ubuntu 18.04虚拟机(使用32G内存,12个核心和300 GB磁盘创建)开始。

执行此操作(并在出现提示时键入sudo密码):

git clone https://gerrit.acumos.org/r/system-integration
cd system-integration/tools/
bash setup_docker.sh
if [[ "$(id -nG "$USER" | grep docker)" == "" ]]; then sudo usermod -aG docker $USER; fi
# Logged out and in again and verified that my user is in the docker group
cd system-integration/tools/
bash setup_k8s_stack.sh setup
cd
bash system-integration/AIO/setup_prereqs.sh k8s acumos.tele.no $USER generic 2>&1 | tee aio_prep.log
# When "Prerequisites setup is complete" messages is displayed I continue with
cd system-integration/AIO
bash oneclick_deploy.sh 2>&1 | tee aio_deploy.log

部署失败,并显示以下错误消息:

....
oneclick_deploy.sh setup_federation:233 (Tue Aug 20 13:47:04 UTC 2019) CDS API is not yet ready; waiting 10 seconds
+ t=300
+ sleep 10
++ curl -k -u ccds_client:27f928e9-cdde-4483-b3c9-7da074972908 https://acumos.tele.no/ccds/peer
++ grep -c numberOfElements
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   203  100   203    0     0   7000      0 --:--:-- --:--:-- --:--:--  7000
+ [[ 0 -eq 0 ]]
+ [[ 300 -eq 300 ]]
+ fail 'CDS API is not ready after 300 seconds'
+ set +x

当我使用Kubernetes仪表板查看实际失败时,我确实看到common-dataservice pod失败了。

我还可以看到docker_proxy以及其他一些pod经常崩溃。

所有安装和错误日志均位于此处: https://www.dropbox.com/sh/61snwd26zbixwl3/AAAWcfBKnIwNkRghXSMQayrEa?dl=0

如果有人能够指导我如何为AI4EU项目(WP3)安装Acumos Boreas进行探索,将不胜感激。

1 个答案:

答案 0 :(得分:0)

Arne,请确保您可以从正在运行的CDS容器中连接到主机“ acumos”。如果这是云服务VM,则可能必须打开安全组规则,以允许VM在其公共IP上与其自身连接(声音是隐式的,但并不总是默认值)。您可以通过

进行测试

kubectl exec -it -n acumos $(kubectl get pods -n acumos -l app = sv-scanning | awk'/ sv-scanning / {print $ 1}')-curl http://acumos:30001

注意:此命令示例使用sv-scanning容器,因为它已安装curl。但是,测试旨在查看 any 容器是否可以连接到MariaDB。默认情况下,如果Acumos域不是DNS可解析的(如/ etc / hosts文件中的条目所示),则将hostAlias添加到每个部署模板中。

(更新)我添加了一个脚本来创建调试容器(基于ubuntu),并将其作为Pod在命名空间下运行。这样,您可以添加任何要调试的工具,例如我已经安装了curl,j1,netcat。使用该容器来验证与http://acumos:30001的连接,签出CDS日志等。

#!/bin/bash
kubectl delete deployment -n acumos debug
while [[ "$(kubectl get pods -n acumos -l app=debug)" != "" ]] ; do
  echo 'waiting...'; sleep 10
done
cat <<EOF >debug.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  namespace: acumos
  name: debug
spec:
  selector:
    matchLabels:
      app: debug
  replicas: 1
  template:
    metadata:
      labels:
        app: debug
    spec:
      containers:
      - name: debug
        image: ubuntu
        command: ['/bin/bash', '-c']
        args:
        - apt-get update; apt-get install -y curl jq netcat;
          sleep 3600;
        volumeMounts:
        - mountPath: /logs
          name: logs
      restartPolicy: Always
      volumes:
      - name: logs
        persistentVolumeClaim:
         claimName: logs
EOF
kubectl create -f debug.yaml
# Wait till running
while [[ $(kubectl get pods -n acumos -o yaml -l app=debug | grep -c 'phase: Running') -eq 0 ]]; do
  echo 'waiting...'; sleep 10
done
kubectl exec -it -n acumos $(kubectl get pods -n acumos -l app=debug -o name | sed 's/pod\///') -- bash
相关问题