我有一个启动一系列线程的应用程序。有时,其中一个线程死亡(通常是由于网络问题)。如何正确检测线程崩溃并重新启动该线程?以下是示例代码:
import random
import threading
import time
class MyThread(threading.Thread):
def __init__(self, pass_value):
super(MyThread, self).__init__()
self.running = False
self.value = pass_value
def run(self):
self.running = True
while self.running:
time.sleep(0.25)
rand = random.randint(0,10)
print threading.current_thread().name, rand, self.value
if rand == 4:
raise ValueError('Returned 4!')
if __name__ == '__main__':
group1 = []
group2 = []
for g in range(4):
group1.append(MyThread(g))
group2.append(MyThread(g+20))
for m in group1:
m.start()
print "Now start second wave..."
for p in group2:
p.start()
在这个例子中,我开始4个线程,然后我开始4个线程。每个线程在0到10之间随机生成int
。如果int
为4
,则会引发异常。请注意,我不是join
线程。我希望运行group1
和group2
个线程列表。我发现如果我加入了线程,它会等到线程终止。我的线程应该是一个守护进程,因此应该很少(如果有的话)点击ValueError
异常,这个示例代码正在显示并应该不断运行。通过加入它,下一组线程不会开始。
如何检测特定线程是否已死亡并仅重新启动该线程?
我在for p in group2
循环后尝试了以下循环。
while True:
# Create a copy of our groups to iterate over,
# so that we can delete dead threads if needed
for m in group1[:]:
if not m.isAlive():
group1.remove(m)
group1.append(MyThread(1))
for m in group2[:]:
if not m.isAlive():
group2.remove(m)
group2.append(MyThread(500))
time.sleep(5.0)
我从this问题中采用了这种方法。
问题在于isAlive()
似乎总是返回True
,因为线程永远不会重启。
修改
在这种情况下使用多处理会更合适吗?我找到了this教程。如果我需要重新启动进程,是否更适合使用单独的进程?似乎重新启动一个线程很困难。
评论中提到我应该针对该帖子检查is_active()
。我在documentation中没有看到这一点,但我确实看到了我目前正在使用的isAlive
。正如我上面提到的,这会返回True
,因此我永远无法看到线程已经死亡。
答案 0 :(得分:3)
除了你期望它崩溃的地方(如果它可以在整个运行函数周围的任何地方)你可能会尝试进行尝试,并且有一个指示器变量具有其状态。
如下所示:
class MyThread(threading.Thread):
def __init__(self, pass_value):
super(MyThread, self).__init__()
self.running = False
self.value = pass_value
self.RUNNING = 0
self.FINISHED_OK = 1
self.STOPPED = 2
self.CRASHED = 3
self.status = self.STOPPED
def run(self):
self.running = True
self.status = self.RUNNING
while self.running:
time.sleep(0.25)
rand = random.randint(0,10)
print threading.current_thread().name, rand, self.value
try:
if rand == 4:
raise ValueError('Returned 4!')
except:
self.status = self.CRASHED
然后你可以使用你的循环:
while True:
# Create a copy of our groups to iterate over,
# so that we can delete dead threads if needed
for m in group1[:]:
if m.status == m.CRASHED:
value = m.value
group1.remove(m)
group1.append(MyThread(value))
for m in group2[:]:
if m.status == m.CRASHED:
value = m.value
group2.remove(m)
group2.append(MyThread(value))
time.sleep(5.0)
答案 1 :(得分:1)
我遇到了类似的问题,偶然发现了这个问题。我发现join使用一个超时参数,并且一旦线程被加入,is_alive将返回False。因此,我对每个线程的审核是:
def check_thread_alive(thr):
thr.join(timeout=0.0)
return thr.is_alive()
这为我检测到线程死亡。