今天出现了这个问题,我不知道发生了什么。请分享你的想法。
我有1个EC2数据库服务器(MYSQL + NFS文件共享+ Memcached)。
我有3个EC2 Web服务器(lighttpd),它将NFS文件夹安装在数据库服务器上。
几个月来一切顺利,但突然间出现了一个有趣的现象。
每隔8分钟到10分钟,PHP文件将无法访问。这将持续约1分钟,然后恢复正常。像.html文件这样的普通文件不受影响。所有服务器都同时具有相同的问题。
我花了一整天的时间来分析原因。最后,我发现问题出现的时候,lighttpd的文件描述符突然增加了很多。
我使用ls /proc/1234/fd | wc -l
来检查fd
的数量。
fd
的#在正常时间约为250。但是,当问题出现时,它将升至1500,然后恢复正常。
听起来很有趣,对吗?你知道发生了什么吗?
======================== 其中一个Web服务器的CPU图。 alt text http://pencake.images.s3.amazonaws.com/4be1055884133.jpg
答案 0 :(得分:1)
思想:
dmesg
输出。 最后......