如何在Kubernetes中模拟Pod故障

时间:2020-08-28 08:44:03

标签: kubernetes robustness

为了在多容器系统上进行一些耐用性测试,我需要以某种方式模拟容器故障。 我不想在部署上使用缩小比例,因为它不太现实。 在我的情况下,删除吊舱也不太有用,因为吊舱很快就会回来。

我检查了以下方面的回复: How to simulate Power Failure In Kubernetes 而且不符合我的需求。 有什么建议吗?

3 个答案:

答案 0 :(得分:1)

您可以检查名为Chaos Mesh的工具。

它具有Pod故障,网络故障,创建压力,IO混乱等选项。混沌网格是专门为Kubernetes及其开源设计的。

还有另一个很棒的工具,叫做Litmus。这也是专门为kubernetes设计的。

答案 1 :(得分:0)

为模拟网络问题,我建议关闭一个节点或将其IP地址弄乱,以使其无法访问。

另一种方法将模拟max out resources。您可以exec进入吊舱并运行一些会消耗大量资源(CPU,RAM)的东西,同时为它们设置限制。或者,您可以将限制设置为低于实际使用量。

您还可以设置探针并模拟其故障。 Liveness探测失败将强制重新启动pod。

最后,您还可以选中Chaos Controller。它提供了用于混乱测试的控制器,并支持一组失败场景。

答案 2 :(得分:0)

也许您可以强调内存使用情况,以免由于OOM问题而终止使用。并尝试杀死容器中运行的主进程,该进程也会重新启动pod。最后,我建议配置错误的活动和就绪探针。

相关问题