我最近一直在考虑如何在我们发布之前测试我们的webapps的性能。我知道我们无法复制此测试的实际用户活动,因为它是新功能。我可以通过查看我们的日志来猜测用户活动,并相应地创建测试,但我想知道这会实现什么。
我很想知道如何:
与现实世界的情景相比,这会让你有多远?
答案 0 :(得分:5)
很大的问题。我们公司已经运行了多年的基准测试和负载测试,主要是基于HTTP的。
在进入复杂场景之前,我们通常从基于 Apache Bench (与Apache捆绑的'ab'命令)的简单基准开始。这不是负载测试,而是性能测试,因为生成的客户端实际上等待HTTP查询完成,然后继续下一步。基本思路是尝试'ab -c N -t 30',其中N = 1,2,4,8,50,100(例如)。您可以快速了解可扩展性和预期的最大吞吐量。
注意:在测试服务器附近运行'ab'命令(理想情况是在同一个局域网上),否则你也会在网络上进行测试(延迟是这里的主要问题)。但在某些商业案例中,这是整个系统(服务器+网络),它真的要进行测试。
从这里开始,如果结果看起来很好(即,througput扩展到服务器端的处理器数量,低或零错误率),我们继续进行负载测试。否则我们搜索瓶颈,因为负载测试只会确认可扩展性问题和一旦负载大于支持的吞吐量(500%内部的100%),很可能会显示可怕的结果错误,连接丢失,大时间,服务器抖动等)。
BTW,通过负载测试,我的意思是使用可以应用给定服务器/应用程序的任何负载的工具,尤其是服务器无法处理的负载(例如:Jmeter,Tsung)。负载测试中非常有趣的是观察服务器过载时发生的情况。当您选择性能不合理的确切测试点时,确定服务器可以处理的最大负载取决于您。然后是猜测或观察现有模式的问题。在许多情况下,我们被要求对新网站进行负载测试,显然没有观察到真实的行为。否则,您可以使用分析并观察前十页:您的场景至少应该遍历它们。您需要一些导航路径:
其他提示:
总的想法是从简单的测试开始逐步进行,否则如果他们没有拟合完美的可扩展性曲线,你将很难解释结果。你猜怎么着?它们永远不适合完美的可扩展性曲线......
答案 1 :(得分:0)