监控持久卷性能

时间:2019-02-20 15:03:59

标签: kubernetes google-compute-engine prometheus google-kubernetes-engine persistent-volumes

用例

我正在Kubernetes中运行一个kafka集群,这在很大程度上取决于适当的磁盘性能(IOPS,吞吐量等)。我正在使用Google的计算引擎磁盘+ Google kubernetes引擎。因此,我知道我创建的磁盘具有以下大约限制:

IOPS(读/写):375/750 吞吐量(MB / s)(读/写):60/60

问题

即使我知道大约IOPS和吞吐量限制,我也不知道我目前实际使用的是什么。我想使用prometheus + grafana对其进行监视,但是找不到任何可以导出磁盘io统计信息以实现持久卷的东西。我发现最好的是kubelet的磁盘空间统计信息:

kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_available_bytes

问题

我必须监视(最好通过prometheus)Kubernetes中附加的我的kafka持久卷的磁盘io使用情况吗?

编辑:

我发现的另一个发现是使用节点导出器的nod​​e_disk_io指标:

rate(node_disk_io_time_seconds_total[5m]) * 100

不幸的是,结果中没有节点名称,甚至没有持久卷(声明)名称。相反,它具有device(例如'sdb')和instance(例如'10 .90.206.10')标签,它们是使我能够监视特定持久卷的唯一标签。这些标签的缺点是它们是动态的,并且可以在容器重启或类似操作时更改。

2 个答案:

答案 0 :(得分:0)

您应该能够使用Stackdriver获得所需的指标。检查新的Stackdriver Kubernetes Monitoring

您可以使用此QWikiLab来测试工具,而无需在您的环境中进行安装。

答案 1 :(得分:0)

您可以使用Stackdriver monitoring查看实例的I / O磁盘。您可以使用Cloud Console并转到VM实例->监视页面以找到它。