mmonit golang重启慢和状态不存在

时间:2015-03-05 04:23:35

标签: go monit

我创建了monit应用,必须在崩溃时重启golang site

$ cd /etc/monit/conf.d 
$ vim checkSite 

使用nohup启动程序并将其pid保存到文件:

check process site with pidfile /root/go/path/to/goSite/run.pid
    start program = "/bin/bash -c 'cd /root/go/path/to/goSitePath; nohup ./goSite > /dev/null 2>&1 & echo $! > run.pid'" with timeout 5 seconds
    stop program = "/bin/kill -9 `cat /root/go/path/to/goSitePath/run.pid`"

它开始了。

Process 'site'
  status                            Running
  monitoring status                 Monitored
  pid                               29723
  parent pid                        1
  uptime                            2m 
  children                          0
  memory kilobytes                  8592
  memory kilobytes total            8592
  memory percent                    0.4%
  memory percent total              0.4%
  cpu percent                       0.0%
  cpu percent total                 0.0%
  data collected                    Thu, 05 Mar 2015 07:20:32

然后测试它在崩溃时如何重启我手动杀死golang site

这里我有两个问题:

  1. 网站重新启动相当慢:虽然在配置中设置with timeout 5 seconds
  2. ,但需要1分钟
  3. 即使在网站实际重启后,site中的monit状态也会变为Does not exist。我想这是因为在杀死并重新启动网站后pid随机变化,但如何克服这一点我不知道。
  4. 重启后

    状态:

    Process 'site'
          status                            Does not exist
          monitoring status                 Monitored
          data collected                    Thu, 05 Mar 2015 08:04:44
    

    如何减少重新启动的时间以及如何修复网站的monit status

    monit日志:

    [Mar  5 08:04:44] error    : 'site' process is not running
    [Mar  5 08:04:44] info     : 'site' trying to restart
    [Mar  5 08:04:44] info     : 'site' start: /bin/bash
    [Mar  5 08:06:44] info     : 'site' process is running with pid 31479
    

    更新

    我的golang网站相当简单:

    package main
    
    import (
        "fmt"
        "github.com/go-martini/martini"
    )
    
    func main() {
        m := martini.Classic()
    
        m.Get("/", func() {
            fmt.Println("main page")
        })
    
        m.Run()
    }
    

    更新2

    我试图通过删除pid文件本身来提高monit重新加载golang网站的速度。假设我做了kill 29723 && rm run.pid并打开计时器以计算再次访问网站的时间。花了85秒。因此删除pid文件并没有帮助monit提高重新加载站点的速度。

1 个答案:

答案 0 :(得分:4)

monit没有任何订阅机制可以中途发现进程是否已经死亡。

daemon mode中,如记录所示,monit通过定期轮询所有已配置规则的状态来工作,其守护周期在守护程序启动时配置,并在某些Linux发行版中默认为2分钟,这意味着在此monit,monit可能需要2分钟才能采取任何行动。

在你的monitrc中检查这个配置,它配置了set daemon指令,例如,如果你想每5秒检查一次状态,那么你应该设置:

set daemon 5

在每个周期,它都会更新其状态,并根据需要执行操作。因此,如果它检测到该进程不存在,它将报告Does not exist直到下一个轮询周期,即使它已经采取决策重新启动它。

timeout指令中的start daemon与此轮询周期没有任何关系,这是monit将启动服务的时间。如果服务在这段时间内没有启动,monit会报告它。

如果monit不符合您的要求,您也可以尝试supervisord,它始终了解已执行程序的状态。