我正在编写一个用于枚举网站域名的python程序。例如,'a.google.com'。
首先,我使用threading
模块执行此操作:
import string
import time
import socket
import threading
from threading import Thread
from queue import Queue
'''
enumerate a site's domain name like this:
1-9 a-z + .google.com
1.google.com
2.google.com
.
.
1a.google.com
.
.
zz.google.com
'''
start = time.time()
def create_host(char):
'''
if char is '1-9a-z'
create char like'1,2,3,...,zz'
'''
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i
char = string.digits + string.ascii_lowercase
site = '.google.com'
def getaddr():
while True:
url = q.get()
try:
res = socket.getaddrinfo(url,80)
print(url + ":" + res[0][4][0])
except:
pass
q.task_done()
NUM=1000 #thread's num
q=Queue()
for i in range(NUM):
t = Thread(target=getaddr)
t.setDaemon(True)
t.start()
for host in create_host(char):
q.put(host+site)
q.join()
end = time.time()
print(end-start)
'''
used time:
9.448670148849487
'''
后来,我读了一本书,说在某些情况下,协同程序比线程更快。所以,我重写了代码以使用asyncio
:
import asyncio
import string
import time
start = time.time()
def create_host(char):
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i
char = string.digits + string.ascii_lowercase
site = '.google.com'
@asyncio.coroutine
def getaddr(loop, url):
try:
res = yield from loop.getaddrinfo(url,80)
print(url + ':' + res[0][4][0])
except:
pass
loop = asyncio.get_event_loop()
coroutines = asyncio.wait([getaddr(loop, i+site) for i in create_host(char)])
loop.run_until_complete(coroutines)
end = time.time()
print(end-start)
'''
time
120.42313003540039
'''
为什么asyncio
getaddrinfo
版本的速度如此之慢?我是否以某种方式滥用了协同程序?
答案 0 :(得分:27)
首先,我无法重现与您在Linux计算机上看到的性能差异几乎一样大的性能差异。我一直看到线程版本大约需要20-25秒,asyncio
版本大约需要24-34秒。
现在,为什么asyncio
会变慢?有一些事情可以促成这一点。首先,asyncio
版本必须按顺序打印,但线程版本不是。打印是I / O,因此GIL可以在发生时释放。这意味着可能有两个或更多线程可以在同一时间打印,但实际上它可能不会经常发生,并且可能不会在性能上产生太大的差异。
其次,更重要的是, asyncio
版getaddrinfo
实际上是just calling socket.getaddrinfo
in a ThreadPoolExecutor
:
def getaddrinfo(self, host, port, *,
family=0, type=0, proto=0, flags=0):
if self._debug:
return self.run_in_executor(None, self._getaddrinfo_debug,
host, port, family, type, proto, flags)
else:
return self.run_in_executor(None, socket.getaddrinfo,
host, port, family, type, proto, flags)
它使用默认ThreadPoolExecutor
,which only has five threads:
# Argument for default thread pool executor creation.
_MAX_WORKERS = 5
对于这个用例而言,这并不是你想要的并行性。为了使其行为更像threading
版本,您需要使用包含1000个主题的ThreadPoolExecutor
,方法是通过loop.set_default_executor
将其设置为默认执行程序:
loop = asyncio.get_event_loop()
loop.set_default_executor(ThreadPoolExecutor(1000))
coroutines = asyncio.wait([getaddr(loop, i+site) for i in create_host(char)])
loop.run_until_complete(coroutines)
现在,这会使行为更加等同于threading
,但这里的现实是你真的没有使用异步I / O - 你只是使用{{1使用不同的API 。因此,您在此处所做的最佳效果与threading
示例相同。
最后,您并未真正在每个示例中运行等效代码 - threading
版本正在使用共享threading
的工作池,而queue.Queue
版本为url列表中的每个项目生成一个协程。如果我使asyncio
版本使用asyncio
和协同程序池,除了删除print语句和创建更大的默认执行程序之外,我得到的两个版本的性能基本相同。这是新的asyncio.Queue
代码:
asyncio
每个的输出:
import asyncio
import string
import time
from concurrent.futures import ThreadPoolExecutor
start = time.time()
def create_host(char):
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i
char = string.digits + string.ascii_lowercase
site = '.google.com'
@asyncio.coroutine
def getaddr(loop, q):
while True:
url = yield from q.get()
if not url:
break
try:
res = yield from loop.getaddrinfo(url,80)
except:
pass
@asyncio.coroutine
def load_q(loop, q):
for host in create_host(char):
yield from q.put(host+site)
for _ in range(NUM):
yield from q.put(None)
NUM = 1000
q = asyncio.Queue()
loop = asyncio.get_event_loop()
loop.set_default_executor(ThreadPoolExecutor(NUM))
coros = [asyncio.async(getaddr(loop, q)) for i in range(NUM)]
loop.run_until_complete(load_q(loop, q))
loop.run_until_complete(asyncio.wait(coros))
end = time.time()
print(end-start)
请注意,由于网络存在一些可变性。它们有时会比这慢几秒。