我创建了monit应用,必须在崩溃时重启golang site
$ cd /etc/monit/conf.d
$ vim checkSite
使用nohup
启动程序并将其pid
保存到文件:
check process site with pidfile /root/go/path/to/goSite/run.pid
start program = "/bin/bash -c 'cd /root/go/path/to/goSitePath; nohup ./goSite > /dev/null 2>&1 & echo $! > run.pid'" with timeout 5 seconds
stop program = "/bin/kill -9 `cat /root/go/path/to/goSitePath/run.pid`"
它开始了。
Process 'site'
status Running
monitoring status Monitored
pid 29723
parent pid 1
uptime 2m
children 0
memory kilobytes 8592
memory kilobytes total 8592
memory percent 0.4%
memory percent total 0.4%
cpu percent 0.0%
cpu percent total 0.0%
data collected Thu, 05 Mar 2015 07:20:32
然后测试它在崩溃时如何重启我手动杀死golang site
。
这里我有两个问题:
with timeout 5 seconds
site
中的monit
状态也会变为Does not exist
。我想这是因为在杀死并重新启动网站后pid
随机变化,但如何克服这一点我不知道。状态:
Process 'site'
status Does not exist
monitoring status Monitored
data collected Thu, 05 Mar 2015 08:04:44
如何减少重新启动的时间以及如何修复网站的monit status
?
monit
日志:
[Mar 5 08:04:44] error : 'site' process is not running
[Mar 5 08:04:44] info : 'site' trying to restart
[Mar 5 08:04:44] info : 'site' start: /bin/bash
[Mar 5 08:06:44] info : 'site' process is running with pid 31479
我的golang网站相当简单:
package main
import (
"fmt"
"github.com/go-martini/martini"
)
func main() {
m := martini.Classic()
m.Get("/", func() {
fmt.Println("main page")
})
m.Run()
}
我试图通过删除pid文件本身来提高monit重新加载golang网站的速度。假设我做了kill 29723 && rm run.pid
并打开计时器以计算再次访问网站的时间。花了85秒。因此删除pid文件并没有帮助monit提高重新加载站点的速度。
答案 0 :(得分:4)
monit没有任何订阅机制可以中途发现进程是否已经死亡。
在daemon mode中,如记录所示,monit通过定期轮询所有已配置规则的状态来工作,其守护周期在守护程序启动时配置,并在某些Linux发行版中默认为2分钟,这意味着在此monit,monit可能需要2分钟才能采取任何行动。
在你的monitrc中检查这个配置,它配置了set daemon
指令,例如,如果你想每5秒检查一次状态,那么你应该设置:
set daemon 5
在每个周期,它都会更新其状态,并根据需要执行操作。因此,如果它检测到该进程不存在,它将报告Does not exist
直到下一个轮询周期,即使它已经采取决策重新启动它。
timeout
指令中的start daemon
与此轮询周期没有任何关系,这是monit将启动服务的时间。如果服务在这段时间内没有启动,monit会报告它。
如果monit不符合您的要求,您也可以尝试supervisord,它始终了解已执行程序的状态。