我们有2个EC2,1个“生产”和1个“接受”。在这些EC2上,我们有一个运行中的docker容器在流通。在生产中,每天都会处理数据,而在接受时则不会。有时,EC2“中断”;我们无法再通过Putty访问EC2,它只会显示黑屏。此外,服务器也不再工作:日常进程停止工作。我们以为这是EC2上的数据存在内存问题,但是,现在EC2的接受程度在周末也中断了,而“接受”服务器上每天都没有处理数据。
如果我查看对EC2的监视,我会发现CPU突然下降到0%(由于docker / airflow,通常约为20%)。网络输入/输出也被丢弃。 重新启动已解决了该问题。但是,我们不希望周末能休息。
有人知道为什么会发生这种情况吗?我们正在使用m4.xlarge。