我有一个小的webapp,可以在Openshift Online上运行9个月,包括python服务和postgresql数据库(当然还有持久卷)
突然间,上周二,postgresql pod停止工作,所以我尝试重新部署服务。现在已经差不多2天了,pod调度经常失败。我在事件日志中有以下条目:
失败调度0/110个节点可用:1个节点有磁盘压力,5个节点有pod不能忍受的污点,6个节点没有匹配节点选择器,98个节点超过最大卷数。 在过去13分钟内37次
所以,它看起来像一个"磁盘已满"在RH的数据中心问题,应该很容易修复,但我在状态页面上看不到任何通知(https://status.starter.openshift.com/)
我的问题看起来很像为start-us-west-1描述的那个:
调查 - 目前Openshift SRE团队试图解决此事件。如果安排附加卷的pod有很多机会,您将面临困难。 对于给您带来的不便,我们深表歉意。
然而,我在start-ca-central-1上,不应该受到影响。由于时间太长,我想知道RH的人是否知道这个问题?但我找不到与初学者计划用户联系的方法
有人在ca-central-1上遇到同样的问题吗?
答案 0 :(得分:2)
正如格雷厄姆在评论中提到的,https://help.openshift.com/forms/community-contact.html是要走的路
在将此问题发布到此链接后的几个小时(实际上是12小时),我收到了RH的某个人的反馈,他说我的请求已被考虑在内。
今天早上,我的应用程序终于启动了,状态页面上出现了问题通知:
调查 - 目前Openshift SRE团队试图解决此事件。如果安排附加卷的pod有很多机会,您将面临困难。 对于给您带来的不便,我们深表歉意。
如果我没有联系他们,我不确定会发生什么......
答案 1 :(得分:0)
在正常工作至少4个月后,我在Starter US West 1上运行的应用突然开始在部署过程中收到以下错误消息:
0/106个节点可用:1个节点具有磁盘压力,29个节点 超过最大数量,有3个节点是不可调度的,有4个节点具有 污点表明Pod无法容忍,6个节点与节点不匹配 选择器,CPU不足63。
在开始失败之前,设置没有任何改变。我已经意识到问题仅发生在具有持久卷的部署中,例如我的情况下就是PostgreSQL Persistent。
我现在通过上述网址提交了此问题。当我得到一些回应或解决方案时,我会在这里发布。