我有一个Kubernetes集群。使用kops
配置,在CoreOS
工作人员上运行。我不时会看到明显的负载峰值,这与Prometheus中node_disk_io_time_ms
指标报告的I / O峰值有关。问题是,我似乎无法使用任何指标来确定此I / O工作负载实际来自何处。像container_fs_*
这样的度量标准似乎没用,因为我总是得到实际容器的零值,以及只有整个节点的任何数据。
关于如何解决在kube cluster / coreos节点中定位I / O负载的问题的任何提示非常欢迎
答案 0 :(得分:1)
如果您使用的是nginx入口,可以使用
进行配置enable-vts-status: "true"
这将为您提供入口处每个pod的一组prometheus指标。指标名称以nginx_upstream_
如果是创建峰值的cronjob,请安装node-exporter daemonset并检查指标container_fs_