我们有一个基于EC2(在us-east-1中为m4.2xlarge)的PostgreSQL数据库,该数据库有时(上星期正常)被阻塞,并且性能受到严重影响。我们已经对几个相关的配置,使用情况和指标进行了故障排除,在数据库使用率较高的情况下,我们似乎仍会出现一些小峰值。
试图找出可能存在的制约因素,一切似乎都归结为硬盘(EBS卷)的性能,但是,由于EBS提供了大量与卷相关的指标,因此我真的不知道它们是否在安全范围内否则它们将被耗尽。
由于时间/增长的原因,数据库存储现在由3个EBS gp2卷(每个分别为1、1和2 TB)组成,我们知道其IOPS比单个4 TB卷要少,但是当迁移到RDS(希望在2月内),但这会花费更长的时间。
每个EBS量均提供以下指标:
1TB卷的最大IOPS为3000,而2TB卷的最大IOPS为6000,但我不知道这是读+写的总和,还是它们各自分开。
吞吐量,延迟和空闲指标如何?我应该怎么看他们?
这是过去3个小时中这三个量的指标的摘要,在CLST CLST(图中中午UTC)前后,我们有了最新的“中断”。
对于指出任何相关指标的任何评论将不胜感激。