如何在kubernetes pods中设置Stackdriver中的错误报告?

时间:2016-04-02 22:45:43

标签: google-compute-engine kubernetes gcloud fluentd stackdriver

我对如何在kubernetes中设置错误报告感到困惑,因此在Google Cloud Console / Stackdriver“错误报告”中可以看到错误?

根据文件 https://cloud.google.com/error-reporting/docs/setting-up-on-compute-engine 我们需要启用流畅的“前向输入插件”,然后从我们的应用程序发送异常数据。我认为如果我们自己设置流畅,这种方法会有效,但它已经预先安装在只运行gcr.io/google_containers/fluentd-gcp docker image的pod中的每个节点上。

我们如何在这些pod上启用前向输入并确保节点上的每个pod都可以使用http端口?当我们向集群添加更多节点时,我们还需要确保默认使用此配置。

任何帮助都会受到赞赏,可能是我从错误的角度看待这一切?

3 个答案:

答案 0 :(得分:14)

基本思想是启动一个单独的pod,它通过TCP接收结构化日志并将其转发到Cloud Logging,类似于本地运行的流畅代理。请参阅下面的步骤。

(不幸的是,无法使用内置于Docker和Kubernetes中的日志记录支持 - 它只是将stdout / stderr中的各行文本作为单独的日志条目转发,以防止错误报告看到完整的堆栈跟踪。)

使用Dockerfile为流利的转发器创建一个泊坞窗图像,如下所示:

FROM gcr.io/google_containers/fluentd-gcp:1.18

COPY fluentd-forwarder.conf /etc/google-fluentd/google-fluentd.conf

fluentd-forwarder.conf包含以下内容:

<source>
  type forward
  port 24224
</source>

<match **>
  type google_cloud
  buffer_chunk_limit 2M
  buffer_queue_limit 24
  flush_interval 5s
  max_retry_wait 30
  disable_retry_limit
</match>

然后构建并推送图像:

$ docker build -t gcr.io/###your project id###/fluentd-forwarder:v1 .
$ gcloud docker push gcr.io/###your project id###/fluentd-forwarder:v1

您需要一个复制控制器(fluentd-forwarder-controller.yaml):

apiVersion: v1
kind: ReplicationController
metadata:
  name: fluentd-forwarder
spec:
  replicas: 1
  template:
    metadata:
      name: fluentd-forwarder
      labels:
        app: fluentd-forwarder
    spec:
      containers:
      - name: fluentd-forwarder
        image: gcr.io/###your project id###/fluentd-forwarder:v1
        env:
        - name: FLUENTD_ARGS
          value: -qq
        ports:
        - containerPort: 24224

您还需要一项服务(fluentd-forwarder-service.yaml):

apiVersion: v1
kind: Service
metadata:
  name: fluentd-forwarder
spec:
  selector:
    app: fluentd-forwarder
  ports:
  - protocol: TCP
    port: 24224

然后创建复制控制器和服务:

$ kubectl create -f fluentd-forwarder-controller.yaml
$ kubectl create -f fluentd-forwarder-service.yaml

最后,在您的应用程序中,而不是使用&#39; localhost&#39;和24224连接到https://cloud.google.com/error-reporting/docs/setting-up-on-compute-engine所述的流利代理,使用环境变量FLUENTD_FORWARDER_SERVICE_HOSTFLUENTD_FORWARDER_SERVICE_PORT的值。

答案 1 :(得分:0)

添加到Boris&#39;回答:只要以正确的格式记录错误(请参阅https://cloud.google.com/error-reporting/docs/troubleshooting)并启用了云记录(您可以在https://console.cloud.google.com/logs/viewer中看到错误),那么错误将使错误报告无需进一步设置。

答案 2 :(得分:0)

鲍里斯的回答很不错,但是要复杂得多,确实需要(不需要构建docker映像)。如果您在本地机器上配置了kubectl(或者您可以使用Google Cloud Shell),请复制并粘贴以下内容,它将在您的群集中安装转发器(我根据上述答案更新了fluent-gcp的版本)。我的解决方案使用ConfigMap来存储文件,因此可以轻松对其进行更改而无需重建。

cat << EOF | kubectl create -f -
apiVersion: v1
kind: ConfigMap
metadata:
  name: fluentd-forwarder
data:
  google-fluentd.conf: |+
    <source>
      type forward
      port 24224
    </source>

    <match **>
      type google_cloud
      buffer_chunk_limit 2M
      buffer_queue_limit 24
      flush_interval 5s
      max_retry_wait 30
      disable_retry_limit
    </match>

---
apiVersion: v1
kind: ReplicationController
metadata:
  name: fluentd-forwarder
spec:
  replicas: 1
  template:
    metadata:
      name: fluentd-forwarder
      labels:
        app: fluentd-forwarder
    spec:
      containers:
      - name: fluentd-forwarder
        image: gcr.io/google_containers/fluentd-gcp:2.0.18
        env:
        - name: FLUENTD_ARGS
          value: -qq
        ports:
        - containerPort: 24224
        volumeMounts:
        - name: config-vol
          mountPath: /etc/google-fluentd
      volumes:
        - name: config-vol
          configMap:
            name: fluentd-forwarder
---
apiVersion: v1
kind: Service
metadata:
  name: fluentd-forwarder
spec:
  selector:
    app: fluentd-forwarder
  ports:
  - protocol: TCP
    port: 24224
EOF