Question

我已经在具有以下清单文件的kubernetes集群上部署了Prometheus-Grafana：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: grafana
  namespace: kube-monitoring
  labels:
    app: grafana
spec:
  replicas: 1
  selector:
    matchLabels:
      app: grafana
  template:
    metadata:
      labels:
        app: grafana
    spec:
      containers:
      - name: grafana
        image: grafana/grafana:6.3.2
        imagePullPolicy: IfNotPresent
        env:
          - name: GF_SECURITY_ADMIN_USER
            value: admin
          - name: GF_SECURITY_ADMIN_PASSWORD
            valueFrom:
              secretKeyRef:
                name: grafana-secret
                key: admin-password
        ports:
        - containerPort: 3000
        resources:
          limits:
            cpu: 500m
            memory: 2500Mi
          requests:
            cpu: 100m
            memory: 100Mi
        livenessProbe:
          exec:
            command:
              - wget
              - localhost:3000
              - --spider
          initialDelaySeconds: 30
          periodSeconds: 30
        volumeMounts:
        - mountPath: /var/lib/grafana
          subPath: grafana
          name: grafana-storage
          readOnly: false
        - mountPath: /etc/grafana/provisioning/datasources/
          name: grafana-datasource-conf
          readOnly: true
        - mountPath: /etc/grafana/provisioning/dashboards/
          name: grafana-dashboards-conf
          readOnly: false
        - mountPath: /var/lib/grafana/dashboards/0/k8s-cluster-usage
          name: grafana-dashboard-k8s-cluster-usage
          readOnly: false
        - mountPath: /var/lib/grafana/dashboards/0/k8s-cluster-nodes
          name: grafana-dashboard-k8s-cluster-nodes
          readOnly: false
        - mountPath: /var/lib/grafana/dashboards/0/k8s-core-dns
          name: grafana-dashboard-k8s-core-dns
          readOnly: false
      securityContext:
        runAsUser: 472
        fsGroup: 472
      restartPolicy: Always
      volumes:
      - name: grafana-storage
        persistentVolumeClaim:
          claimName: pvc-grafana
      - name: grafana-datasource-conf
        configMap:
          name: grafana-datasource-conf
          items:
            - key: datasource.yaml
              path: datasource.yaml
      - name: grafana-dashboards-conf
        configMap:
          name: grafana-dashboards-conf
          items:
            - key: dashboards.yaml
              path: dashboards.yaml
      - name: grafana-dashboard-k8s-cluster-usage
        configMap:
          name: grafana-dashboard-k8s-cluster-usage
      - name: grafana-dashboard-k8s-cluster-nodes
        configMap:
          name: grafana-dashboard-k8s-cluster-nodes
      - name: grafana-dashboard-k8s-core-dns
        configMap:
          name: grafana-dashboard-k8s-core-dns

并且仪表板配置为https://pastebin.com/zAYn9BhY（太长）

列表Core DNS和Cluster Usages中显示了正确的数据和图表，但是Cluster Nodes并没有显示所有数据，所有度量标准都表示No data points

任何人都可以在这里帮助您吗？

Answer 1

Cluster Nodes不会显示任何指标，因为您可能缺少metric-server。

如果您盯着整个Prometheus堆栈，我会考虑使用通过头盔部署的prometheus-operator。这有点让人不知所措，但是您可以以一种非常简单的方式开始使用它，而prometheus-operator也将部署metrics-server。

Grafana仪表板未显示数据（在EKS上）

1 个答案: