如何优化此Asyncio代码片段,以便在突发期间每秒发出更多请求?

时间:2019-03-21 04:46:13

标签: python python-3.x performance python-asyncio aiohttp

这是我的小段代码。这只是一个异步循环,向Twilio发送10个发布请求:

import time
import aiohttp
import asyncio


async def asynchronous():
    tasks = [f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo'),
             f('NumberFrom', 'NumberTo', 'asyncio imo')]
    await asyncio.gather(*tasks)


async def f(NumberFrom, NumberTo, MessageBody):
    try:
        print('Sent at %s' % time.time())
        async with aiohttp.ClientSession() as session:
            await session.post('https://api.twilio.com/2010-04-01/Accounts/AuthPass/Messages.json',
                                data={'From': NumberFrom, 'To': NumberTo, 'Body': MessageBody}, 
                                auth=aiohttp.BasicAuth(login='AuthUser', password='AuthPass'))
        print('Done at at %s' % time.time())
    except Exception as err:
        print('Error encountered at %s' % time.time())


asyncio.run(asynchronous())

在有人问之前,我已经在Twilio开了一个付费帐户,并且不释放或发送垃圾邮件。我不是要用短信轰炸任何人。我只需要偶尔发送一连串消息,并且每条消息都需要或多或少地同时发送到不同的号码。

当前,我正在使用线程模块执行此操作。我为每个消息启动一个单独的线程。几个数字就可以了,但是当您需要打开多个线程时,效率就会降低。每次执行此操作时,我都必须打开20个线程,并且比起线程,我正在寻求一种更高效的异步发送20个帖子请求的方法。

这是我现在使用asyncio的表现:

>>> asyncio.run(asynchronous())
0.0
Sent at 1553142004.4640338
Sent at 1553142004.5059218
Sent at 1553142004.5119061
Sent at 1553142004.5178897
Sent at 1553142004.5238738
Sent at 1553142004.5288606
Sent at 1553142004.5348446
Sent at 1553142004.5388453
Sent at 1553142004.5448182
Sent at 1553142004.5488071
Done at 1553142004.9834092
Done at 1553142004.9913745
Done at 1553142005.0013483
Done at 1553142005.0153105
Done at 1553142005.0264556
Done at 1553142005.0342588
Done at 1553142005.0472543
Done at 1553142005.0581958
Done at 1553142005.066205
Done at 1553142005.0731542
>>> 

我平均每秒大约有100个帖子请求。由于某种原因,我认为异步会比这快。我已经读过Python的文章,该文章每秒能够处理1,000,000个请求。我没想到,我只是想我可以从异步中获得更多数量级的性能。

我的代码中是否存在明显的错误,该错误正在降低asyncio或其他工具的效率?还是这仅仅是asyncio可以做到的高峰?我对Python并不陌生,但是对asyncio却并不陌生,所以我不知道我在这里做什么。请说明任何明显的内容。

作为参考,我正在运行4核心3.2GHz intel i7处理器,该脚本是当时唯一运行的脚本。我知道我的CPU不是瓶颈。

运行此程序时,我的互联网峰值速度约为250Kbps,但这远不及我的ISP上限3.5Mbps。我知道我的互联网不是瓶颈。

我正在IDLE shell中的Python 3.7.2中运行此脚本。

1 个答案:

答案 0 :(得分:2)

您应将自定义连接器传递给会话:

connector = aiohttp.TCPConnector(limit=None)
async with aiohttp.ClientSession(connector=connector) as session:
    # ...

对此的原因进行了详细解释,here


还要注意,article关于发出百万个请求并不能保证“每秒”。

您可能将article与使用Japronto在服务器端处理请求的方法混淆了,这是完全不同的(没有提及本文有自己的issues)。


更新:

总是存在与准备请求有关的开销。您可以尝试使用单个会话来节省一些时间:

import time
import aiohttp
import asyncio


async def asynchronous():
    async with aiohttp.ClientSession() as session:
        tasks = [f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session),
                 f('NumberFrom', 'NumberTo', 'asyncio imo', session)]
        await asyncio.gather(*tasks)


async def f(NumberFrom, NumberTo, MessageBody, session):
    try:
        print('Sent at %s' % time.time())
        await session.get('http://httpbin.org/delay/1')
        print('Done at at %s' % time.time())
    except Exception as err:
        print('Error encountered at %s' % time.time())


asyncio.run(asynchronous())