添加现有 PVC 后,Grafana Pod 处于 Init Error 状态

时间:2021-05-22 18:15:20

标签: kubernetes grafana

使用 helm charts 安装 grafana,部署顺利,grafana ui 启动,需要添加一个存在持久化卷,运行以下 cmd:

helm install grafana grafana/grafana -n prometheus --set persistence.enabled=true --set persistence.existingClaim=grafana-pvc

init 容器崩溃,日志如下:

kubectl logs grafana-847b88556f-gjr8b -n prometheus -c init-chown-data                    
chown: /var/lib/grafana: Operation not permitted
chown: /var/lib/grafana: Operation not permitted

在检查部署 yaml 时发现此部分:

initContainers:
      - command:
        - chown
        - -R
        - 472:472
        - /var/lib/grafana
        image: busybox:1.31.1
        imagePullPolicy: IfNotPresent
        name: init-chown-data
        resources: {}
        securityContext:
          runAsNonRoot: false
          runAsUser: 0
        terminationMessagePath: /dev/termination-log
        terminationMessagePolicy: File
        volumeMounts:
        - mountPath: /var/lib/grafana
          name: storage
      restartPolicy: Always
      schedulerName: default-scheduler
      securityContext:
        fsGroup: 472
        runAsGroup: 472
        runAsUser: 472
      serviceAccount: grafana
      serviceAccountName: grafana

为什么使用 runAsUser: 0 运行但操作失败?并且 pvc 有 access:ReadWriteMany,有什么解决方法吗?或者我错过了什么

谢谢!!

2 个答案:

答案 0 :(得分:1)

NFS 默认开启 root_squash 模式,这会在功能上禁用作为超级用户的客户端上的 uid 0(将这些请求映射到其他一些 UID/GID,通常是 65534)。您可以在挂载选项中禁用此功能,或使用 NFS 以外的其他内容。我会推荐后者,NFS 很糟糕。

答案 1 :(得分:0)

实际上,有时您可能希望避免更改存储提供商设置,或者根本不可能。

就我而言,问题中描述的错误是在部署 kube-prometheus-stack helm chart 时发生的。我无法访问存储提供程序设置,所以我通读了图表的示例值,我注意到以下部分:

initChownData:
  ## If false, data ownership will not be reset at startup
  ## This allows the prometheus-server to be run with an arbitrary user
  ##
  enabled: true

我将 enabled 更改为 false,并且在 helm upgrade ... pod 成功初始化并且存储按预期工作之后。与更改存储提供商的安全策略相比,这似乎是更安全的解决方案,当然也需要更少的努力。