我们正在使用 Fargate 集群来评估 POC 并将我们现有的服务转移到 ECS Fargate 计算。我们有 2 个从 SQS 队列读取和处理请求的任务。几天来,我们遇到了问题,从服务调用 AWS IoT 的延迟增加。在此之前,该服务似乎运行良好。我查看了 JMX 级别的主机指标,并没有注意到那里有任何危险信号。日志中似乎有这个反复出现的问题,我怀疑这可能是一个贡献者。
Caused by: javax.net.ssl.SSLException: Couldn't kickstart handshaking
at sun.security.ssl.Alert.createSSLException(Alert.java:127) ~[?:?]
Suppressed: java.net.SocketException: Socket closed
Caused by: java.net.SocketException: Socket closed
java.lang.reflect.InvocationTargetException: null`
我们的 SLA 不断被违反,导致出现许多 AWS SDK ClientExecutionTimeoutException
。服务基础结构是使用 cdk 中的 QueueProcessingFargateService 构造设置的。
关于可能是什么问题的任何想法。