我有一个Kubernetes集群进行分布式(并行)数据处理,该结果将结果写入DB。
由于数据库的网络吞吐量性能受到限制,我面临的并行性似乎受到限制。
不过,我也被告知要调查集群,即确保集群中的1000多个Pod确实能够提高吞吐量,并且受到数据库接收此吞吐量的能力的限制。数据。
推荐哪些方法来监视Kubernetes群集网络吞吐量(或网络性能)?
为了监视CPU和内存消耗,我在Kubernetes仪表板中使用Heapster,这很好。
对于高度并行的工作负载,我实际上发现了最普遍的网络问题(即,我的节点拥有足够的CPU和内存资源,但是我怀疑没有足够的网络带宽来写所有这些内容)数据成功发送到数据库)。
我已经查看了几篇类似this的文章,但它似乎涵盖了连通性问题(可访问性),但是并不能用于监视整个集群的通信量。
如果可能的话,我真的在寻找可以显示“所有Pod都在生成X量的网络流量”的信息。