我正在寻找一种从Google App Engine到第三方服务的速率限制请求的有效方法。第三方服务费率基于每个帐户限制请求,而在Google App Engine方面,大部分工作都在内部任务中执行。令牌桶是一种很好的通用算法。
问:有什么方法可以用来有效地限制每个帐户而不是每个服务的请求?这不应涉及设置GAE任务队列的费率,因为每个帐户的请求数量和服务的帐户数量会有很大差异。出于性能原因,我最感兴趣的是基于memcache(incr / decr?)的想法!
我认为这归结为基于memcache的令牌桶?
思想?
答案 0 :(得分:1)
前一段时间我将这个项目保留为书签:http://code.google.com/p/gaedjango-ratelimitcache/
不是您特定问题的答案,但也许可以帮助您入门。
答案 1 :(得分:1)
我知道这是一个老问题,但它是一个顶级搜索结果,我认为其他人可能会找到一个我有用的替代方案。它比上面的解决方案更精细(直到第二个),简单(只有一个函数)和高性能(只有一个memcache查找):
import webapp2
from functools import wraps
from google.appengine.api import memcache
def rate_limit(seconds_per_request=1):
def rate_limiter(function):
@wraps(function)
def wrapper(self, *args, **kwargs):
added = memcache.add('%s:%s' % (self.__class__.__name__, self.request.remote_addr or ''), 1,
time=seconds_per_request, namespace='rate_limiting')
if not added:
self.response.write('Rate limit exceeded.')
self.response.set_status(429)
return
return function(self, *args, **kwargs)
return wrapper
return rate_limiter
class ExampleHandler(webapp2.RequestHandler):
@rate_limit(seconds_per_request=2)
def get(self):
self.response.write('Hello, webapp2!')
答案 2 :(得分:1)
以下是我在GAE上使用memcache实现令牌桶的方法:
编辑:采取(另一个)刺伤。
这部分来自https://github.com/simonw/ratelimitcache/blob/master/ratelimitcache.py
def throttle(key, rate_count, rate_seconds, tries=3):
'''
returns True if throttled (not enough tokens available) else False
implements token bucket algorithm
'''
client = memcache.Client(CLIENT_ARGS)
for _ in range(tries):
now = int(time.time())
keys = ['%s-%s' % (key, str(now-i)) for i in range(rate_seconds)]
client.add(keys[0], 0, time=rate_seconds+1)
tokens = client.get_multi(keys[1:])
tokens[keys[0]] = client.gets(keys[0])
if sum(tokens.values()) >= rate_count:
return True
if client.cas(keys[0], tokens[keys[0]] + 1, time=rate_seconds+1) != 0:
return False
logging.error('cache contention error')
return True
以下是用法示例:
def test_that_it_throttles_too_many_requests(self):
burst = 1
interval = 1
assert shared.rate_limit.throttle('test', burst, interval) is False
assert shared.rate_limit.throttle('test', burst, interval) is True
def test_that_it_doesnt_throttle_burst_of_requests(self):
burst = 16
interval = 1
for i in range(burst):
assert shared.rate_limit.throttle('test', burst, interval) is False
time.sleep(interval + 1) # memcache has 1 second granularity
for i in range(burst):
assert shared.rate_limit.throttle('test', burst, interval) is False