在自动缩放组中,我们有一堆t2.xlarge EC2竞价型实例在ELB后面运行。他们每个人运行36个服务于请求的docker容器。在过去的几周中,我们一直遇到有关SQS推送失败的问题,这些推送在一分钟后以ReadTimeoutError: Read timeout on endpoint URL: "https://us-west-2.queue.amazonaws.com/
失败,并且只有在第一次尝试后才成功。消息是小的有效载荷。这仅在某些情况下发生,并且通常与将同一个有效负载缓慢插入到dynamodb表中同时发生。可能是什么原因造成的?
我们使用boto3将消息发送到SQS:
queue.send_message(MessageBody=json.dumps(item))