应用错误收集

时间：2018-06-07 07:48:22

标签： openshift

我有一个小的webapp，可以在Openshift Online上运行9个月，包括python服务和postgresql数据库（当然还有持久卷）

突然间，上周二，postgresql pod停止工作，所以我尝试重新部署服务。现在已经差不多2天了，pod调度经常失败。我在事件日志中有以下条目：

失败调度0/110个节点可用：1个节点有磁盘压力，5个节点有pod不能忍受的污点，6个节点没有匹配节点选择器，98个节点超过最大卷数。在过去13分钟内37次

所以，它看起来像一个＆＃34;磁盘已满＆＃34;在RH的数据中心问题，应该很容易修复，但我在状态页面上看不到任何通知（https://status.starter.openshift.com/）

我的问题看起来很像为start-us-west-1描述的那个：

调查 - 目前Openshift SRE团队试图解决此事件。如果安排附加卷的pod有很多机会，您将面临困难。对于给您带来的不便，我们深表歉意。

然而，我在start-ca-central-1上，不应该受到影响。由于时间太长，我想知道RH的人是否知道这个问题？但我找不到与初学者计划用户联系的方法

有人在ca-central-1上遇到同样的问题吗？

答案 0 :(得分：2)

正如格雷厄姆在评论中提到的，https://help.openshift.com/forms/community-contact.html是要走的路

在将此问题发布到此链接后的几个小时（实际上是12小时），我收到了RH的某个人的反馈，他说我的请求已被考虑在内。

今天早上，我的应用程序终于启动了，状态页面上出现了问题通知：

调查 - 目前Openshift SRE团队试图解决此事件。如果安排附加卷的pod有很多机会，您将面临困难。对于给您带来的不便，我们深表歉意。

如果我没有联系他们，我不确定会发生什么......

答案 1 :(得分：0)

在正常工作至少4个月后，我在Starter US West 1上运行的应用突然开始在部署过程中收到以下错误消息：

0/106个节点可用：1个节点具有磁盘压力，29个节点超过最大数量，有3个节点是不可调度的，有4个节点具有污点表明Pod无法容忍，6个节点与节点不匹配选择器，CPU不足63。

在开始失败之前，设置没有任何改变。我已经意识到问题仅发生在具有持久卷的部署中，例如我的情况下就是PostgreSQL Persistent。

我现在通过上述网址提交了此问题。当我得到一些回应或解决方案时，我会在这里发布。