对我的应用程序运行负载测试时,我看到非常一致的响应时间。一旦GAE的负载水平恒定,平均响应时间就越来越小。 但我想在其他应用程序上获得相同的一致性,这些应用程序每秒接收的请求数量要少得多。在那些我永远不需要支持超过约3个请求/秒。
Reading the docs让我觉得增加最小空闲实例的数量会导致更一致的响应时间。但即使这样,每次GAE的调度程序认为需要更多实例时,客户端仍然会看到更高的响应时间。我正在寻找一个用户看不到那些初始缓慢请求的设置。
当我将最小空闲实例数增加到1时,我希望GAE仅使用一个常驻实例。随着负载的增加,它应该启动并预热新的(动态)实例。 Only once they are warmed up,GAE应向他们发送请求。 但从响应时间来看,似乎客户端请求在动态实例中随着它们的出现而到达。因此,这些请求需要很长时间(最多30秒)。
在负载测试期间或当有足够多的人使用该应用时,我没有遇到此问题。但是当我没有人使用应用程序时,我的测试环境几乎无法被客户端使用,例如在早上。
谢谢!
答案 0 :(得分:1)
一些通用的想法:
可悲的是,没有任何通用技巧可以避免这种情况,但你可以尝试
如果您不介意成本(并且不需要为小批量应用程序自动扩展),您甚至可以通过永远在线的后端提供所有请求