Question

用例

我正在Kubernetes中运行一个kafka集群，这在很大程度上取决于适当的磁盘性能（IOPS，吞吐量等）。我正在使用Google的计算引擎磁盘+ Google kubernetes引擎。因此，我知道我创建的磁盘具有以下大约限制：

IOPS（读/写）：375/750 吞吐量（MB / s）（读/写）：60/60

问题

即使我知道大约IOPS和吞吐量限制，我也不知道我目前实际使用的是什么。我想使用prometheus + grafana对其进行监视，但是找不到任何可以导出磁盘io统计信息以实现持久卷的东西。我发现最好的是kubelet的磁盘空间统计信息：

kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_available_bytes

问题

我必须监视（最好通过prometheus）Kubernetes中附加的我的kafka持久卷的磁盘io使用情况吗？

编辑：

我发现的另一个发现是使用节点导出器的node_disk_io指标：

rate(node_disk_io_time_seconds_total[5m]) * 100

不幸的是，结果中没有节点名称，甚至没有持久卷（声明）名称。相反，它具有device（例如'sdb'）和instance（例如'10 .90.206.10'）标签，它们是使我能够监视特定持久卷的唯一标签。这些标签的缺点是它们是动态的，并且可以在容器重启或类似操作时更改。

Answer 1

您应该能够使用Stackdriver获得所需的指标。检查新的Stackdriver Kubernetes Monitoring。

您可以使用此QWikiLab来测试工具，而无需在您的环境中进行安装。

Answer 2

您可以使用Stackdriver monitoring查看实例的I / O磁盘。您可以使用Cloud Console并转到VM实例->监视页面以找到它。