我使用FreeBSD 11.1-RELEASE amd64
在FreeBSD机器[pkg install py27-supervisor
]上安装了进程管理器管理器,并按如下方式在supervisor.conf文件中填充了相关选项:
[unix_http_server]
file=/var/tmp/supervisor.sock ; (the path to the socket file)
[supervisord]
logfile=/var/log/supervisor/supervisord.log ; (main log file;default $CWD/supervisord.log)
logfile_maxbytes=50MB ; (max main logfile bytes b4 rotation;default 50MB)
logfile_backups=10 ; (num of main logfile rotation backups;default 10)
loglevel=info ; (log level;default info; others: debug,warn,trace)
pidfile=/var/run/supervisord.pid ; (supervisord pidfile;default supervisord.pid)
nodaemon=false ; (start in foreground if true;default false)
minfds=1024 ; (min. avail startup file descriptors;default 1024)
minprocs=200 ; (min. avail process descriptors;default 200)
;umask=022 ; (process file creation umask;default 022)
;user=chrism ; (default is current user, required if root)
;identifier=supervisor ; (supervisord identifier, default is 'supervisor')
;directory=/tmp ; (default is not to cd during start)
;nocleanup=true ; (don't clean up tempfiles at start;default false)
;childlogdir=/tmp ; ('AUTO' child log dir, default $TEMP)
;environment=KEY=value ; (key value pairs to add to environment)
;strip_ansi=false ; (strip ansi escape codes in logs; def. false)
[supervisorctl]
serverurl=unix:///var/tmp/supervisor.sock ; use a unix:// URL for a unix socket
;serverurl=http://127.0.0.1:9001 ; use an http:// url to specify an inet socket
[include]
files = supervisord.d/*
files = /etc/supervisor/conf.d/*
我为日志文件创建一个文件夹:/var/log/supervisor
,然后使用supervisord -c /etc/supervisord.conf
命令在监督下启动。各个进程.conf文件存储在/etc/supervisor/conf.d/
文件夹中。我使用supervisorctl -c /etc/supervisord.conf start <process_name>
命令启动单个进程。
此过程可以运行一段时间。但是,几天后,该过程将无法执行。当我使用supervisorctl -c /etc/supervisord.conf status
命令检查服务状态时,出现unix:///var/tmp/supervisor.sock refused connection
错误,而当我运行ps aux | grep super
时,似乎supervisor没有运行。
我在supervisord -c /etc/supervisord.conf
的监督下手动启动
并获取输出:Unlinking stale socket /var/tmp/supervisor.sock
。然后,我使用supervisorctl -c /etc/supervisord.conf restart all
重新启动进程,几天后它又能正常工作,直到再次遇到相同的问题。
虽然我知道此问题的快速解决方案,但我想知道是什么首先导致了它,以及如何防止它每隔几天连续发生一次? 谢谢。