我有一个连接到许多服务器之一的Web服务器。 Web服务器最多可以排队40个作业,每个作业可能需要20分钟或30个小时才能运行。
Web服务器使用套接字连接到serverlet,serverlet运行使用线程发送的作业。
我想对可以一次运行的线程(作业)的数量设置上限,比如3,一旦达到该限制,它就会保留主线程。当其中一个线程结束时,它允许主线程继续并拾取另一个作业。
# Wait for thread count to reduce before continuing
while threading.active_count() >= self.max_threads:
pass
我正在使用循环使我的主线程等待,直到有一个免费线程可用。它有效,但感觉就像一个快速而肮脏的解决方案。我想知道是否有更好的方法可以做到这一点?
server.py
import socket
import sys
import urllib, urllib2
import threading
import cPickle
from supply import supply
class supply_thread(threading.Thread):
def __init__(self, _sock):
threading.Thread.__init__(self)
self.__socket = _sock
def run(self):
data = self.readline()
self.__socket.close()
new_supply = supply.supply(data)
new_supply.run()
def readline(self):
""" read data sent from webserver and decode it """
data = self.__socket.recv( 1024 )
if data:
data = cPickle.loads(data)
return data
class server:
def __init__(self):
## Socket Vars
self.__socket = None
self.HOST = ''
self.PORT = 50007
self.name = socket.gethostname()
self.max_jobs = 3
def listen(self):
""" Listen for a connection from the webserver """
self.__socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# Allows quick connection from the same address
self.__socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
self.__socket.bind((self.HOST, self.PORT))
return self.__socket.listen(1)
def connect(self):
webserver = self.__socket.accept()[0]
print 'Connected by', webserver
new_thread = supply_thread(webserver)
print 'Starting thread' , new_thread.getName()
new_thread.start()
def close(self):
return self.__socket.close()
def run(self):
import time
while True:
print(sys.version)
# Wait for connection from Webserver
self.listen()
time.sleep(3)
# Let the Webserver know I'm avilable
self.status(status='Available')
print 'Waiting for connection...'
self.connect()
print 'thread count:', threading.enumerate()
print 'thread count:', threading.active_count()
while threading.active_count() >= self.max_jobs:
pass
def status(self, status='Available'):
computer_name = socket.gethostname()
svcURL = "http://localhost:8000/init/default/server"
params = {
'computer_name':computer_name,
'status':status,
'max_jobs':self.max_jobs
}
svcHandle = urllib2.urlopen(svcURL, urllib.urlencode(params))
答案 0 :(得分:5)
这听起来像是Celery的一个很好的用例。
基本上,您可以在tasks.py
文件中创建Celery任务,然后使用taskname.delay()
调用它。如果工作人员准备好接受另一项任务,它会将任务分派给Celery工作人员并开始工作。这是an example from the docs。
默认情况下,Celery将创建一个并发等于计算机according to the documentation中核心数的工作程序。如果需要,您可以更改。