我最近遇到了一个问题,即php-fpm进程使用(如在活动进程的数量中)达到最大可用进程,并停止执行其他脚本,直到有问题的进程完成。
更详细一点, 我目前的php-fpm设置是:
pm = static
pm.max_children = 100
我正在观看php-fpm的状态页面,其中大部分时间显示:
total processes: 100
idle processes: 95-99
active processes: 1-5
这是正常的。 但是,几分钟内,活动进程计数会在几秒钟内跳至100,然后恢复到1-5的正常状态。在那段时间内,服务器上运行的所有其他脚本都会停留一段时间。 (从浏览器中您只看到页面等待。)
现在,我已经检查了它是否在特定的流量峰值,但它没有。它也可以在当天最低流量计数的情况下发生。
我相信某个脚本,甚至只是在特定情况下,会导致php出于某种原因简单地使用所有可用的进程。
一旦我们从5.2.X
迁移到PHP 5.4.X,就开始了这个问题我们目前有大约60个网站,因此有点难以浏览每个网站的网页并进行检查。
nginx日志中没有任何内容(无论如何都没有关键,有一些通知等)。
我正在尝试做什么,以某种方式跟踪/配置文件/监视哪个php-fpm脚本正在使用这些进程,所以我将知道从哪里开始寻找问题。
这可能吗?也许是一种不同的方法?
更新
以下是1小时内PHP-FPM流程计数的图表,间隔为1分钟:
我用红色标记了我正在谈论的跳跃。 尖峰时的内存使用量保持不变
答案 0 :(得分:28)
在你的php-fpm日志文件中,你应该可以看到类似的内容:
WARNING: [pool www-images] server reached pm.max_children setting (5), consider raising it.
当活动进程数达到限制时。您应该能够将其与即将发出的请求相关联。
如果没有显示任何导致问题的请求的模式,那么你应该在php-fpm配置中添加慢速日志记录:
request_slowlog_timeout = 10
slowlog = /var/log/php-fpm/slow.$pool.log
将记录每个请求的堆栈跟踪,该请求占用的速度超过slowlog_timeout限制。
如果仍然没有显示任何内容,则内部应用程序日志记录应显示减速发生的位置。
如果没有足够的细节,那么您可以使用strace作为最后的手段,它将显示正在进行的系统调用。这将产生大量信息。我建议只将它附加到单个进程strace -p PID
,其中PID是php-fpm实例的processID。
它也可以在当天最低流量计数的情况下发生。
那肯定应该出现在php-fpm慢日志中。但是,如果只显示哪个请求很慢,但无法帮助您找出原因,则可以在PHP-FPM配置文件中使用auto pre和post-pend文件添加调试。
php_value[auto_prepend_file]=/php_shared/prepend.php
php_value[auto_append_file]=/php_shared/postpend.php
您可以设置PHP-FPM状态页面。
将此添加到PHP-FPM池配置:
pm.status_path = /www-status
并通过nginx将请求传递给PHP-FPM
location ~ ^/(www-status)$ {
include %mysite.root.directory%/conf/fastcgi.conf;
fastcgi_pass unix:%phpfpm.socket%/php-fpm-www.sock;
# or IP address
# fastcgi_pass 127.0.0.1:9000;
#If you're fastcgi.conf doesn't set the query_string
#pass the query string here instead.
# fastcgi_param QUERY_STRING $query_string;
fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
allow 127.0.0.1;
allow stats_collector.localdomain;
allow watchdog.localdomain;
deny all;
}
然后转到yoursite.com/www-status?full将为您提供每个php-fpm流程的大字体,例如:
pool: www
process manager: dynamic
start time: 18/Mar/2013:20:17:21 +1100
start since: 243
accepted conn: 3
listen queue: 0
max listen queue: 0
listen queue len: 0
idle processes: 3
active processes: 1
total processes: 4
max active processes: 1
max children reached: 0
slow requests: 0
************************
pid: 6233
state: Idle
start time: 18/Mar/2013:20:17:21 +1100
start since: 243
requests: 1
request duration: 631
request method: GET
request URI: /www-status
content length: 0
user: -
script: /documents/projects/intahwebz/intahwebz/basereality/www-status
last request cpu: 0.00
last request memory: 262144
顺便说一句,我打赌它会锁定你的数据库。