我想根据请求数量扩展部署。每个pod只能一次处理一个请求。扩展是没有问题的,但是当我想缩小时,我想确保我没有杀死正在运行的pod(例如编码大文件)。
我有以下的播客:
如果我减少副本值,kubernetes会杀死pod 3.它不关心pod是否繁忙。我可以手动杀死pod 2,所以kubernetes会开始一个新的:
在我知道pod 2被杀后我可以减少计数器的数量,因此pod 4将在执行任务之前被杀死。但这个解决方案听起来非常难看,因为其他人必须告诉pod 2关闭。
所以kubernetes会杀掉最后创建的那个,但是有可能告诉他,一个pod正忙着他必须等待才能被杀死吗?