python多处理守护进程中的僵尸进程

时间:2011-06-21 16:35:31

标签: python daemon multiprocessing zombie-process

在研究python守护进程之后,这个步骤似乎是最强大的:http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/

现在我正在尝试在守护进程类中实现一个工作池,我认为它正在工作(我还没有彻底测试代码),除了在关闭时我得到一个僵尸进程。我已经阅读了我需要等待孩子的返回代码,但我还是看不出我到底需要做什么。

以下是一些代码段:

def stop(self):
    ...
    try:
        while 1:
            self.pool.close()
            self.pool.join()
            os.kill(pid, SIGTERM)
            time.sleep(0.1)
    ...

在这里,我尝试了os.killpg和一些os.wait方法,但没有任何改进。我还在closing之前和之后使用了joining / os.kill游戏池。这个循环,它永远不会结束,一旦它到达os.kill我得到一个僵尸进程。 self.pool = Pool(processes=4)发生在守护程序的__init__部分。从run(self)之后的start(self)开始,我会致电self.pool.apply_async(self.runCmd, [cmd, 10], callback=self.logOutput)。但是,我想在讨论之前解决这个僵尸进程。

如何在守护进程中正确实现池以避免这个僵尸进程?

1 个答案:

答案 0 :(得分:4)

在不知道子/守护进程中发生了什么的情况下,不可能对答案有100%的信心,但请考虑是否可以这样做。由于您的子进程中有工作线程,因此在收到SIGTERM后,实际上需要构建一些逻辑来连接所有这些线程。否则,您的过程可能不会退出(即使它确实您可能无法正常退出)。要做到这一点,你需要:

  • 编写一个信号处理程序,用于捕获SIGTERM信号并触发主线程事件的子/守护程序进程
  • 在子/守护程序进程的主线程(非常重要)中安装信号处理程序
  • SIGTERM的事件处理程序必须向子/守护进程中的所有线程发出停止指令
  • 所有线程在完成后必须加入()ed(如果您假设SIGTERM会自动销毁您可能必须执行此逻辑的所有内容)。
  • 一旦连接并清理完所有内容,您就可以退出主线程

如果你有I / O线程和各种各样的东西,那么这将是一个真正的苦差事。

此外,我通过实验发现,当您使用信号处理程序时,事件监听器的特定策略很重要。例如,如果使用select.select(),则必须使用超时,并在超时发生时重试;否则你的信号处理程序将无法运行。如果您有事件的Queue.Queue对象,并且您的事件侦听器调用其.get()方法,则必须使用超时,否则您的信号处理程序将无法运行。 (在VM中的C中实现的“真实”信号处理程序运行,但除非您使用超时,否则您的Python信号处理程序不会。)

祝你好运!