Question

我正在寻找一种从Google App Engine到第三方服务的速率限制请求的有效方法。第三方服务费率基于每个帐户限制请求，而在Google App Engine方面，大部分工作都在内部任务中执行。令牌桶是一种很好的通用算法。

问：有什么方法可以用来有效地限制每个帐户而不是每个服务的请求？

这不应涉及设置GAE任务队列的费率，因为每个帐户的请求数量和服务的帐户数量会有很大差异。出于性能原因，我最感兴趣的是基于memcache（incr / decr？）的想法！

我认为这归结为基于memcache的令牌桶？

思想？

Answer 1

前一段时间我将这个项目保留为书签：http://code.google.com/p/gaedjango-ratelimitcache/

不是您特定问题的答案，但也许可以帮助您入门。

Answer 2

我知道这是一个老问题，但它是一个顶级搜索结果，我认为其他人可能会找到一个我有用的替代方案。它比上面的解决方案更精细（直到第二个），简单（只有一个函数）和高性能（只有一个memcache查找）：

import webapp2
from functools import wraps
from google.appengine.api import memcache


def rate_limit(seconds_per_request=1):
  def rate_limiter(function):
    @wraps(function)
    def wrapper(self, *args, **kwargs):
      added = memcache.add('%s:%s' % (self.__class__.__name__, self.request.remote_addr or ''), 1,
                           time=seconds_per_request, namespace='rate_limiting')
      if not added:
        self.response.write('Rate limit exceeded.')
        self.response.set_status(429)
        return
      return function(self, *args, **kwargs)
    return wrapper
  return rate_limiter


class ExampleHandler(webapp2.RequestHandler):
  @rate_limit(seconds_per_request=2)
  def get(self):
    self.response.write('Hello, webapp2!')

Answer 3

以下是我在GAE上使用memcache实现令牌桶的方法：

编辑：采取（另一个）刺伤。

这部分来自https://github.com/simonw/ratelimitcache/blob/master/ratelimitcache.py

def throttle(key, rate_count, rate_seconds, tries=3):
    '''
    returns True if throttled (not enough tokens available) else False
    implements token bucket algorithm
    '''
    client = memcache.Client(CLIENT_ARGS)
    for _ in range(tries):
        now = int(time.time())
        keys = ['%s-%s' % (key, str(now-i)) for i in range(rate_seconds)]
        client.add(keys[0], 0, time=rate_seconds+1)
        tokens = client.get_multi(keys[1:])
        tokens[keys[0]] = client.gets(keys[0])
        if sum(tokens.values()) >= rate_count:
            return True
        if client.cas(keys[0], tokens[keys[0]] + 1, time=rate_seconds+1) != 0:
            return False
    logging.error('cache contention error')
    return True

以下是用法示例：

def test_that_it_throttles_too_many_requests(self):
    burst = 1
    interval = 1
    assert shared.rate_limit.throttle('test', burst, interval) is False
    assert shared.rate_limit.throttle('test', burst, interval) is True


def test_that_it_doesnt_throttle_burst_of_requests(self):
    burst = 16
    interval = 1
    for i in range(burst):
        assert shared.rate_limit.throttle('test', burst, interval) is False
    time.sleep(interval + 1) # memcache has 1 second granularity
    for i in range(burst):
        assert shared.rate_limit.throttle('test', burst, interval) is False

基于Memcache的速率限制算法？（令牌桶？）

3 个答案:

基于Memcache的速率限制算法？ （令牌桶？）

3 个答案:

基于Memcache的速率限制算法？（令牌桶？）