基于Memcache的速率限制算法? (令牌桶?)

时间:2010-09-05 21:48:58

标签: google-app-engine rate-limiting

我正在寻找一种从Google App Engine到第三方服务的速率限制请求的有效方法。第三方服务费率基于每个帐户限制请求,而在Google App Engine方面,大部分工作都在内部任务中执行。令牌桶是一种很好的通用算法。

问:有什么方法可以用来有效地限制每个帐户而不是每个服务的请求?

这不应涉及设置GAE任务队列的费率,因为每个帐户的请求数量和服务的帐户数量会有很大差异。出于性能原因,我最感兴趣的是基于memcache(incr / decr?)的想法!

我认为这归结为基于memcache的令牌桶?

思想?

3 个答案:

答案 0 :(得分:1)

前一段时间我将这个项目保留为书签:http://code.google.com/p/gaedjango-ratelimitcache/

不是您特定问题的答案,但也许可以帮助您入门。

答案 1 :(得分:1)

我知道这是一个老问题,但它是一个顶级搜索结果,我认为其他人可能会找到一个我有用的替代方案。它比上面的解决方案更精细(直到第二个),简单(只有一个函数)和高性能(只有一个memcache查找):

import webapp2
from functools import wraps
from google.appengine.api import memcache


def rate_limit(seconds_per_request=1):
  def rate_limiter(function):
    @wraps(function)
    def wrapper(self, *args, **kwargs):
      added = memcache.add('%s:%s' % (self.__class__.__name__, self.request.remote_addr or ''), 1,
                           time=seconds_per_request, namespace='rate_limiting')
      if not added:
        self.response.write('Rate limit exceeded.')
        self.response.set_status(429)
        return
      return function(self, *args, **kwargs)
    return wrapper
  return rate_limiter


class ExampleHandler(webapp2.RequestHandler):
  @rate_limit(seconds_per_request=2)
  def get(self):
    self.response.write('Hello, webapp2!')

答案 2 :(得分:1)

以下是我在GAE上使用memcache实现令牌桶的方法:

编辑:采取(另一个)刺伤。

这部分来自https://github.com/simonw/ratelimitcache/blob/master/ratelimitcache.py

def throttle(key, rate_count, rate_seconds, tries=3):
    '''
    returns True if throttled (not enough tokens available) else False
    implements token bucket algorithm
    '''
    client = memcache.Client(CLIENT_ARGS)
    for _ in range(tries):
        now = int(time.time())
        keys = ['%s-%s' % (key, str(now-i)) for i in range(rate_seconds)]
        client.add(keys[0], 0, time=rate_seconds+1)
        tokens = client.get_multi(keys[1:])
        tokens[keys[0]] = client.gets(keys[0])
        if sum(tokens.values()) >= rate_count:
            return True
        if client.cas(keys[0], tokens[keys[0]] + 1, time=rate_seconds+1) != 0:
            return False
    logging.error('cache contention error')
    return True

以下是用法示例:

def test_that_it_throttles_too_many_requests(self):
    burst = 1
    interval = 1
    assert shared.rate_limit.throttle('test', burst, interval) is False
    assert shared.rate_limit.throttle('test', burst, interval) is True


def test_that_it_doesnt_throttle_burst_of_requests(self):
    burst = 16
    interval = 1
    for i in range(burst):
        assert shared.rate_limit.throttle('test', burst, interval) is False
    time.sleep(interval + 1) # memcache has 1 second granularity
    for i in range(burst):
        assert shared.rate_limit.throttle('test', burst, interval) is False