我们最近开始出现间歇故障,表现为500 errors on our EB instances
。它们似乎是在我们通过Sidekiq
发送电子邮件通知的同时发生的,但并非总是如此。
在nginx错误日志中,我看到了与失败相对应的以下消息:"connect() to unix:///var/run/puma/my_app.sock failed"
我已经搜索了该错误并进行了一些更改,特别是调整了ulimit值:
files:
"/etc/security/limits.conf":
mode: "000644"
owner: root
group: root
content: |
* soft nofile 16384
* hard nofile 65536
* soft nproc 16384
* hard nproc 65536
那根本没有帮助。我有一个具有完全相同代码的暂存环境,从来没有这个问题,因此这似乎是一个扩展问题。
我们确实在相同的实例上与Sidekiq
一起运行Puma/nginx
,但这似乎很常见,但是我不禁怀疑这是否与问题有关。
您可以建议任何想法或其他故障排除步骤吗?