我正在调查生产的Postgres RDS实例(m4.xlarge,400 GiB的gp2存储)上查询延迟增加了大约3个小时。
驱动程序似乎是磁盘读写延迟的峰值:我看到它们从基线〜0.0005上升到0.0136写延迟/ 0.0081读延迟的峰值。
我还看到磁盘队列深度从基线的大约2增加到峰值14。
当磁盘延迟激增时,我通常希望看到写入磁盘的数据有所增加。但是,在延迟增加的时间内,读取iOPS,写入iOPS,读取吞吐量和写入吞吐量都下降了(约50%)。
我还对正在发送的总查询量有服务器端指标(以每秒查询数和写入的数据量来衡量:这是写繁重的工作量),并且在这段时间内这些指标持平
我对接下来要研究的内容一无所知。在iOP下降时磁盘延迟可能增加的可能原因是什么?